OpenAI 研究人员:AI 系统或可在两年内处理大部分研究工作

Gate 新闻消息,4 月 29 日——OpenAI 的研究人员 Sébastien Bubeck 和 Ernest Ryu 表示,AI 系统可能在两年内完成大部分人类研究工作,并将数学作为衡量 AI 进展的清晰标尺。与模糊的性能测试不同,数学问题提供精确的验证:答案要么正确,要么错误,不留任何模棱两可的空间。

Bubeck 指出,真正的 AI 思考要求能够在长链推理中存活下来。在多步骤论证中出现一个错误,就会使整个证明崩塌,因此,对先进模型而言,过程中进行错误检测与修正才是终极目标。OpenAI 的内部实验室已经生成了十多项完全崭新的定理,并且可在顶级组合数学期刊发表,表明 AI 现在产出的是真正原创、具有突破性的工作,而不仅仅是将现有论文重新拼接组合。

然而,要实现持续的科学突破,就需要在数周的测试中保持稳定的专注。目前的系统仍需要严格的人类监督,以引导并核验方向每一次转变。Bubeck 用“AGI 时间”来衡量一个模型能独立模仿人类思考多久;目前系统大约在几天到一周的量级运行,而行业目标是达到数周或数月,以便在诸如生物学等领域实现自主工作。

长久记忆对于这一未来至关重要。标准的聊天窗口会限制深度——复杂的数学证明往往超过 50 页——而代码仓库则展示了更长时间的工作会话如何带来更深入的难题求解。随着 AI 获得更强的独立性与记忆,人类专业知识反而会更有价值,而不是更低。工作人员必须保留深厚的基础性知识,用以质疑并核验机器给出的答案;同时,组织也需要新的自动化过滤器与声誉系统,以便在大量由 AI 辅助的研究涌入之时维持信任。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Musk 与 Altman 诉讼首周证词:自承 XAI 蒸馏 OpenAI,警告 AI 像终结者

马斯克在奥克兰联邦法院首周诉讼证词中指控奥特曼与 Brockman 骗取早期非营利资金,警告 AI 末日风险,并自承 xAI 部分蒸馏自 OpenAI 模型;他自述投入 3,800 万美元,见证 OpenAI 从非营利转为估值 8 千亿 美元。Microsoft 2022 投资被视为信任崩坏的转折点。OpenAI 辩称马斯克企图挖角、并以竞争对手动机抗辩。随后在第二周证人包括 Russell 与 Brockman。

鏈新聞abmedia1小时前

与特朗普有关的 AI 金融收购 Block Street,金额 4300 万美元

据《财富》,AI Financial,这家与特朗普家族有关的加密货币公司此前名为 Alt5 Sigma,上周以 4300 万美元收购了 Block Street,一家加密基础设施公司。AI Financial 的顾问兼 Block Street 的首席执行官 Matthew Morgan 表示,该收购并非一项

GateNews1小时前

Riot 的股价在扩大 AMD 数据中心合作后上涨 8%

比特币矿企 Riot 的股价在其与 AMD 的数据中心协议扩展后上涨 8%。扩展后的合作包括改善的融资条款,凸显 Riot 正在从比特币挖矿转向人工智能数据中心运营的战略转变。此举表明信心日益增强

GateNews4小时前

明尼苏达州禁止 AI 非自愿色情影像工具,并处以最高 $500K 罚金

据 Decrypt 称,明尼苏达州议会于 5 月 2 日通过了一项法案,禁止网站和应用程序提供可生成未经同意的亲密图像的 AI 工具,且这些图像涉及可识别的个人。该法律禁止平台允许用户访问或使用此类“深度伪造”工具,并禁止

GateNews6小时前

ChatGPT 用户现在可在 OpenClaw 平台上访问订阅,萨姆·奥尔特曼宣布

根据 Sam Altman 今天的公告,ChatGPT 用户现在可以使用他们的 ChatGPT 账号登录 OpenClaw 代理平台,并直接访问他们在该平台上的现有 ChatGPT 订阅。

GateNews6小时前

xAI 推出 Grok 定制语音,让用户在一分钟内克隆自己的 AI 语音

据 Beating,xAI 发布了 Grok Custom Voices 和 Voice Library,允许用户在 xAI 控制台录制一分钟音频,以生成一个自定义的 voice_id,用于 Grok TTS 和 Voice Agent API。该功能支持包括客服代理、内容创作在内的应用,

GateNews7小时前
评论
0/400
暂无评论