热点资讯

新闻资讯

你的位置：九游娱乐 - 最全游戏有限公司 > 新闻资讯 > 九游娱乐 - 最全游戏有限公司高想考进度摧毁的算力（横轴）也径直拉满-九游娱乐 - 最全游戏有限公司

九游娱乐 - 最全游戏有限公司高想考进度摧毁的算力（横轴）也径直拉满-九游娱乐 - 最全游戏有限公司

发布日期：2026-02-08 05:02 点击次数：171

OpenAI 公布下一代模子九游娱乐 - 最全游戏有限公司，o1 之后径直o3！

"双 12 "直播活动终末一天，终于来了个大的，奥特曼本东谈主也再次现身直播间。

o3 比较 o1 最卓绝的收货，一是顶尖方法员竞赛CodeForces分数跨越 2700，东谈主类跨越这个分数的目下唯一不到 200 个。

二是在为 AGI 准备的测试ARC-AGI上分数从 32% 跃升到了 75.7%、87.5%。

为什么有两个收货呢？

因为 o3 相沿低想考进度和高想考进度两种建造，高想考进度摧毁的算力（横轴）也径直拉满。

ARC-AGI 是 Keras 之父 Fran ç ois Chollet 发起的测试基准，典型题目为图形逻辑推理。

另一项测试是堪称最难数学测试的EpochAI Frontier Math，包含最新未公开前沿题目。

此前陶哲轩对这项测试的第一印象是"可能难住 AI 好几年"。

o3 在测试中比之前 SOTA 从 2 分普及到 25 分。

东谈主类专科数学家措置其中一齐题目也要摧毁数小时到数天，当今 o3 只需要想考几分钟了。

此次直播还公布了o3-mini，相沿低中高三种想考进度建造。

主要展示了代码智力，低建造下 o3-mini 和 o1-mini 差未几，中高建造如故跨越了 o1 郑再版。

参与臆测的北大学友任泓宇，现场展示了 o3-mini 的编程智力。

他使用了极端版块的 ChatGPT，称为 ChatGPT α。

任务如下：

写一个 Python 剧本，在土产货为一个带有大文本框的 HTML 文献启动就业器。当我在该框中输入文本并按下提交时，它应该将该代码请求发送到 OpenAl o3-mini API ，使用 medium reasoning_effort ，获得生成的代码，将其保存到桌面上的临时文献中，然后在新的 Python 结尾中执行该文献。还有一些细节：

不错在 ~/api_key 中找到我的 API 密钥

请在向 API 的请求中添加一些非凡的指示，指定它只应复返莫得任何体式或 Markdown 的原始代码

你将在 Mac 札记本电脑环境启动

o3-mini 的想考进程用了 38 秒，然后代码秒出，一次启动告成。