OpenAI 在 2024 年 9 月 13 日这个特别的日子里,为我们带来了全新的惊喜。OpenAI o1 是 OpenAI 首个具有 “推理” 能力的大模型,这意味着它能够像人类一样通过逐步分析问题的推理过程,最终得出正确结论。这种能力的实现,将极大地拓展人工智能在各个领域的应用场景。
各位朋友,从上述内容中我们可以看出,OpenAI o1 的出现确实引起了全球 AI 领域的高度关注。众多知名企业家、科学家纷纷对其进行了评价,而这些评价也呈现出了明显的分歧。
OpenAI 的高管和研究员们对新模型给予了高度评价,认为它开启了新一轮的 AI 技术范式,将帮助大模型走向更复杂的推理时代。这无疑显示出他们对自家产品的信心和自豪。他们作为 OpenAI 的内部人员,对模型的研发过程有着深入的了解,因此他们的好评也在一定程度上反映了 OpenAI o1 在技术上的重大突破。
然而,OpenAI 之外的 “编外人士” 则给出了相对克制的评价。他们虽然没有否定 OpenAI o1 的创新,但认为新模型的能力还没有被充分测试,并且距离通用人工智能(AGI)依旧很遥远。这些观点也有其合理性。毕竟,一个新的技术产品在刚推出时,确实需要经过更多的实践检验和时间的考验。而且,AGI 一直是人工智能领域的一个远大目标,目前的技术水平离实现 AGI 还有很长的路要走。
OpenAI总裁格雷格·布罗克曼(Greg Brockman):OpenAI o1是我们首个通过强化学习进行训练的模型,它在回答问题之前会进行深思熟虑。这是一个充满巨大机遇的新模型,无论在数量(推理度量已有显著提升)还是质量(通过简单英语“阅读模型的思维”,忠实的思维链让模型变得更可解释)上,都有明显改进。
这项技术仍处于早期阶段,带来了新的安全机会,我们正在积极探索,包括可靠性、幻觉问题以及对抗性攻击的鲁棒性。
作为OpenAI创始成员之一,前特斯拉AI高级总监安德烈·卡帕西(Andrej Karpathy)的评论画风格外不同,他吐槽了模型的“懒惰”问题:OpenAI o1-mini一直拒绝为我解决黎曼假设(Riemann Hypothesis),模型的“懒惰”仍然是一个主要问题。
国内网友对 OpenAI o1 的评价因人而异。一些网友认为 OpenAI o1 具有强大的推理能力,在数学、编程等领域表现出色,是人工智能技术的重要进步。
例如,看到 o1 在相关测试中的优异成绩,如在国际数学邀请赛、编程竞赛以及物理、化学和生物等学科的基准测试中超越了其他模型甚至人类专家的表现,会对其能力表示认可。
差评网友认为,并没有那么牛!
HuggingFace首席执行官兼联合创始人克莱门特·德兰吉(Clement Delangue):再一次,人工智能系统并不是在“思考”,而是在“处理”和“运行预测”——就像谷歌或电脑一样。这种技术往往给人一种错误的印象,让你觉得这些系统像人类一样智能,但这只是廉价的宣传和营销策略,让你觉得它们比实际情况更聪明。
一些国内网友持相对谨慎或保留的态度。他们可能会注意到 o1 存在的一些局限性,如处理速度较慢,可能需要超过 10 秒才能回答一个问题;功能上还有欠缺,目前无法浏览网页、处理文件和图像,也不是多模态模型;在模型输出的质量方面,可能比其他模型更容易产生 “幻觉”,即生成看似合理但实际上并不准确的信息等。
此外,部分网友可能认为不能仅仅根据测试成绩就完全肯定 o1 的实际应用效果,还需要在更多实际场景中进行检验。也有人觉得大模型的能力难以被量化,其实际效果和价值增益应该在市场中得到终极检验,而不是仅依赖榜单排名。
正如一些国内大模型创业者和专业人士所指出的,大模型的评价体系较为复杂,不能仅通过与其他模型的比较或单项得分来判断其真实能力。部分自媒体的炒作和新模型发布时的宣传可能导致大家对模型之间的差距产生误解,实际情况可能并非如宣传所示那么乐观。同时,他们也期待 OpenAI 能够不断改进和完善 o1,以更好地满足用户需求和实际应用场景的需要。
需要注意的是,网友的观点是多样化的,上述内容只是对一些常见观点的总结,不能代表所有国内网友的看法。每个人对新技术的理解和期望都可能不同。
要使用 OpenAI o1,可以按照以下步骤进行操作:
注册并登录 ChatGPT plus 或 team 账户;
在 ChatGPT 中手动选择 o1 模型;
根据具体需求选择 o1-preview 或 o1-mini 模型。o1-preview 是预览版,而 o1-mini 是更小、成本更低的版本;
输入具体的任务或问题,让模型进行推理和解答;
评估模型的输出结果,并根据需要进行调整。
需要注意的是,目前 o1 模型存在一些局限性。例如,它只是一款 “纯文字版”,暂时无法浏览网页信息以及上传文件和图片,不具备 ChatGPT 的许多使用功能,在许多常见用例中可能不如 GPT-4o 那么强大,而且还有用量限制,o1-preview 每周上限为 30 条消息,o1-mini 每周上限为 50 条。
另外,o1 模型的使用成本较高。在 API 中,o1-preview 每 100 万个输入 token 收费 15 美元,是 GPT-4o 成本的三倍,每 100 万个输出 token 收费 60 美元,是 GPT-4o 成本的四倍。
OpenAI o1 是新推出的模型,其性能和使用体验可能会随着时间推移而有所变化,同时 OpenAI 也可能会对其使用方式和相关政策进行调整,建议关注 OpenAI 官方网站获取最新信息。
本文链接:https://yunguke.com/chatgpt/403.html
OpenAI-o1OpenAI o1OpenAI01chatgpt o1o1-minio1-previewOpenAI o1 miniOpenAI o1 previewOpenAI o1官网OpenAI o1官网入口OpenAI o1地址OpenAI o1中文版openai o1模型简介
网友评论