Table of Contents
OpenAI O1:人工智能的新范例
OpenAI 推出了一款名为 O1 的新旗舰模型,它可以自我 "推理",引领人工智能和龙8国际娱乐城的新范式
🚀 OpenAI 推出 O1
OpenAI 刚刚推出了新的 O1 模型,它可以在回答用户的询问之前进行自我 "推理",从而打破了复杂任务的所有基准。
新的 OpenAI 模型(内部代号也是 "草莓/Q*")的传闻由来已久,甚至在 Twitter 上引发了 "伊利亚看到了什么 "之类的阴谋论。人们早就怀疑它是一个能自我推理、自我完善的模型,现在终于真相大白了。
🙋♀️ 它是如何工作的?
OpenAI O1 或称 "草莓 "是一个自我推理模型,可以在回答问题前进行多步推理。该模型将复杂的任务分解成多个步骤,然后尝试解决。它还能进行自我批判,这意味着如果根据给定的上下文,它能在方向错误时进行自我纠正。
这与 COT 或思维链提示的工作原理非常相似,但关键区别在于 COT 步骤本身是通过 RL 训练出来的,这就开启了一种新的扩展模式。因此,命名从 GPT-4o 退回到 "O1"。
早期的 LLM 有一个很长的预训练步骤,需要使用大量计算,以便 LLM 创建一个世界模型并捕捉所有信息。然后在测试时(即我们向它提问时),它只需根据所学知识直接回答问题即可。但现在有了 O1,LLM 会采取多个步骤对输入进行自我推理,然后给出答案。开始时,O1 的推理步骤相对较少,即 10-20 步,耗时 15-20 秒,但 OpenAI 计划将其扩展到数小时、数天和数周!想象一下,让一个 LLM 提出癌症的治疗方法,然后它推理数周后给出答案。
O1 的现状如何?
就基准而言,与 GPT-4o(以及 Claude Sonnet 3.5)相比,O1 打破了所有顶级复杂基准。这里的复杂任务是指编写代码、理解和分析 PRD、阅读医学报告或撰写小说。基本上,任何任务都需要批判性思维。
但另一方面,O1 的基本能力是有限的,有时在完成写个人信息或编辑博客等简单任务时,其表现甚至不如 GPT-4o。
如何试用 O1!
现在我们来谈谈如何使用 O1!目前 ChatGPT Plus 用户可以直接在 chatGPT 上使用 O1,但有非常严格的速率限制。
O1-preview :每周30 个请求 O1-mini :每周50 个请求
您还可以通过梅林专业版查看 O1,它的费率限制要好得多!
未来
OpenAI O1 迈出了一大步,它不仅是继 gpt-4o 之后的又一个新模型,而且是训练 LLM 的新方法,是对计算的一种思考,意味着在性能开发方面还有很长的路要走。
随着 OpenAI 再次确立其强大的领先地位,停滞不前的人工智能大战将再次白热化。
Experience the full potential of ChatGPT with Merlin
Bhavesh Chaudhari
程序员。将创意变为现实。全栈网络开发人员。