鞭牛士报道,12月6日消息,据外电报道,周四,在「OpenAI12天」活动的现场演示中,OpenAI宣布推出新版ChatGPT,其使用限制更高,每月收费200美元,并推出「o1」的完整版本,「o1」是该公司于9月推出的所谓推理模型的完整版本。
与o1-preview不同,o1现在可以处理图像和文本(类似于GPT-4o),据报道它比o1-preview快得多。
在一个关于罗马皇帝的演示问题中,o1花了14秒回答,而1个预览花了33秒。
据OpenAI称,o1犯重大错误的次数比o1-preview少34%,而思考速度快50%。一旦部署完成,将GPU转换为新模型,该模型的速度也会变得更快。
目前尚不完全清楚新的ChatGPTPro订阅是否值得每月200美元的费用,但该公司明确表示,用户将可以使用功能更强大的o1版本,即o1Pro模式,该版本将进行更深入的推理搜索,并在回答问题之前提供对更困难问题的更强大的思考能力。
今天,我们推出了ChatGPTPro,这是一项每月200美元的计划,可让您大规模访问OpenAI的最佳模型和工具。该计划包括无限制访问我们最智能的模型OpenAIo1,以及o1-mini、GPT-4o和AdvancedVoice。它还包括o1pro模式,这是o1的一个版本,它使用更多的计算来更深入地思考,并为最困难的问题提供更好的答案。未来,我们预计将为该计划添加更强大、计算密集型的生产力功能。
OpenAI在其新闻稿中写道:ChatGPTPro为研究人员、工程师和其他每天使用研究级智能的个人提供了一种方法来提高他们的生产力并处于人工智能进步的前沿。
OpenAI声称可靠性有所提高
OpenAI大力宣传专业模式的可靠性得到提升,该模式内部评估的依据是它是否能在四次尝试中四次正确解决问题,而不是一次尝试。
OpenAI写道:在外部专家测试人员的评估中,o1pro模式能够产生更可靠、更准确、更全面的响应,尤其是在数据科学、编程和案例法分析等领域。
即使没有专业模式,OpenAI也指出,在流行的数学和编码基准测试(AIME2024和Codeforces)上,其性能比o1预览模型有显著提升,在博士级科学基准测试(GPQADiamond)上也有更微小的改进。
在这些基准测试中,o1和o1专业模式之间的分数增幅要小得多。
一旦o1的完整版本广泛推出,媒体可能会对其进行更多报道——它应该在今天推出,全球的ChatGPTPlus和Team用户都可以使用。企业和教育用户将于下周开始使用。