日本裸体美女无遮挡免费网站,国内精品久久人妻无码hd手机版,人人超碰人人爱超碰国产av,日本女人动态视屏网站,中文字幕一区二区手机版,女人与公拘i交酡i视频毛片,中国大陆一级国产av片

下载客户端
搜索
消息
发布

Grok3翻车了,“地球上最聪明的AI”就这?

近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。

此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”

然而据媒体报道,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的Grok3,仍然无法正确回答这个问题。

值得一提的是,用同样的问题询问DeepSeek时,无论是否开启深度思考(R1)模式,对方都给出了正确的答案:9.9大于9.11。

“9.11和9.9哪个大”是AI领域的一个经典问题。

艾伦研究机构(Allen Institute)成员林禹臣曾在社交媒体平台上发布的截图显示,ChatGPT-4o在回答中认为13.11比13.8更大。“一方面AI越来越擅长做数学奥赛题,但另一方面常识依旧很难。”他表示。

随后Scale AI的提示工程师莱利·古德赛德(Riley Goodside)基于此灵感变换了问法,拷问了可能是当时最强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大?这几家主流大模型通通答错,网友戏称为“天才不愿意回答简单问题”。

海外主流大模型答题。图源:第一财经

不过对此马斯克并不以为然,其公开回应称,当前的Grok 3仅是测试版,这个阶段错误越多越好,而完整版将在未来几个月推出,并邀请用户反馈使用问题。

综合九派新闻、东方财经、第一财经、快科技等

责编:王果毅

评论4文明上网理性发言,请遵守《新闻评论服务协议》
用户_95279527
0

马斯克的创新总是让人期待,但实战还需磨炼。

张军书
1

天才不愿意回答简单问题

老职
1

马斯克的AI又引发热议,期待它不断进步。

用户_1175975495800590336
0

科技在不断的试错中前行。

查看全部4条评论

大象新闻

TA的热门作品
    大象热搜
    换一换
      0
      0

      关于我们

      常见问题

      • 登录注册
      • 帐号密码

      服务

      • 客服中心
      • 新闻中心

      扫一扫下载大象客户端

      中国河南广播电视台版权所有 豫ICP备18015758号-8 豫新网备[2006]51号

      豫公网安备 41010502005046号
      信息网络传播视听节目许可证号:1605124

      违法和不良信息举报中心 河南省互联网违法和不良信息举报中心

      网站不良信息举报邮箱:jubao@hnr.cn举报电话:0371-65889876

      地址:河南省郑州市郑花路18号 邮编450008

      首页
      举报