9.11比9.9大？马斯克的Grok3实测翻车了

2025-02-19 15:53:39 大象新闻

近日，马斯克与xAI团队，在直播中正式发布了最新版本Grok3。

此前，马斯克将Grok-3描述为“地球上最聪明的AI”，比Deepseek更好。他在X平台上表示：“自己整个周末都在和团队打磨产品。”

然而据媒体报道，有人测试了最新的Beta版Grok3，并提出了那个经典的用来刁难大模型的问题：“9.11与9.9哪个大？”遗憾的是，在不加任何定语以及标注的情况下，号称目前最聪明的Grok3，仍然无法正确回答这个问题。

不过对此马斯克并不以为然，其公开回应称，当前的Grok 3仅是测试版，这个阶段错误越多越好，而完整版将在未来几个月推出，并邀请用户反馈使用问题。

在媒体看来，尽管在官方PPT中，Grok3在大模型竞技场 Chatbot Arena 中看似“遥遥领先”，但实际上其与DeepSeek R1和GPT4.0 的差距仅为1%到2%。

值得一提的是，用同样的问题询问DeepSeek时，无论是否开启深度思考（R1）模式，对方都给出了正确的答案：9.9大于9.11。

（综合：九派新闻、快科技、东方财经、第一财经、中国新闻周刊等）

责编：张家赫

评论文明上网理性发言，请遵守《新闻评论服务协议》

大象新闻

关注

大象热搜

换一换

关于我们

常见问题

服务

扫一扫下载大象客户端

信息网络传播视听节目许可证号：1605124

网站不良信息举报邮箱：jubao@hnr.cn举报电话：0371-65889876

地址：河南省郑州市郑花路18号　邮编450008