Skip to main content
Anthropic podcast

Anthropic推迟下一代AI模型Opus 3.5发布

       Anthropic公司首席执行官Dario Amodei确认,公司正在研发其旗舰AI模型Claude Opus的新版本Opus 3.5,但他并未透露具体的发布时间。这一更新最初计划于今年推出,然而Amodei现在只含糊地表示它将在“某个时刻”到来,反映了整个行业在开发具有先进能力的大语言模型方面的趋势。

       在与播客主持人Lex Fridman的访谈中,Amodei指出,最近更新并发布的Haiku 3.5的性能已经与原版Opus 3持平,同时运行速度更快、成本更低。公司下一个目标是进一步提升性能曲线。

       Opus 3.5的推迟反映了AI行业的一个更广泛趋势。自GPT-4亮相以来,大语言模型在能力上并没有取得重大突破。相反,进展更加微妙——完善细节和提高效率。领先的公司如OpenAI和谷歌据报道也在努力应对他们最新模型的延迟和令人失望的结果,寻求开发更强大的AI系统的新方法。

长达数月的开发周期和众多不确定性

       在播客中,Anthropic的首席执行官揭开了开发这些AI模型的复杂性。仅预训练阶段就可能持续数月,Amodei说,这需要大量的计算能力——成千上万的专用芯片,如GPU或TPU。

       初始训练后,模型会经过一个复杂的微调过程。其中关键部分是“从人类反馈中进行强化学习”。人类专家会仔细审查模型的输出,并根据不同标准进行评分,以帮助模型学习和改进。

       然后是一系列内部测试和外部审计,以检查安全问题,通常与美国和英国的AI安全小组合作。

       Amodei说,尽管AI的突破可能对行业外的人来说看起来像是科学飞跃,但实际上很多进展都归结为乏味的技术细节。最难的部分通常是像软件开发和使模型运行更快这样的事情,而不是大的概念进步。模型的“智能”和“个性”在每个新版本中可能会不可预测地变化。Amodei认为,正确地做到这一点更像是一门艺术而不是科学。

 

免责声明:除原创作品外,本平台所使用的文章、图片、视频及音乐属于原权利人所有,因客观原因或会存在不当使用的情况,如,部分文章或文章部分引用内容未能及时与原作者取得联系,或作者名称及原始出处标注错误等情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系。