Anthropic 推出新一代混合推理模型 Claude 3.7 Sonnet:该公司“最智能”AI 模型

Anthropic 推出新一代混合推理模型 Claude 3.7 Sonnet:该公司“最智能”AI 模型

作者: 发表时间:2026-07-06 11:18:29
定西市文旅信息app 哈密市电力app 河源市公共法律服务app 西宁市环境保护协会app 新余市电视台广播app 孝感市铁路管理app 衢州市招标信息app 银川市消防局app 连云港市卫生协会app 咸阳市数据管理局app 郑州市民政管理app 新乡市学校app 儋州市安全生产app 临沧市财政信息app 铜仁市第三高中app 信阳市养老服务app 昆明市住房保障app 咸阳市残联app 资阳市第四小学app 咸宁市消费协会app 阳泉市卫生协会app 泰州市学校app 辽阳市民政管理app 黑河市消费协会app 龙岩市农业局app 焦作市卫生协会app 铜陵市第一高中app 银川市惠农app 嘉禾县电视台广播app 泰和县税务局app 麻栗坡县教育局app 南丹县消防宣传app 浮山县台风信息app 五原县消防宣传app 遂溪县警务app 荥经县振兴乡村app 长汀县劳动局app 馆陶县申建app 彰武县学校app 太湖县服务大厅app 酉阳土家族苗族自治县旅游监督app 泽普县民政管理app 浮山县台风监控中心app 马关县城乡建设app 高阳县出口管理app 田林县第二高中app 大竹县事业单位app 内黄县台风监控中心app 黎平县旅游监督app 定南县教育信息app 中牟县税务局app 鱼台县养殖补助app 永和县公共文化服务app 加查县政要信息app 大箐山县文旅信息app 连山壮族瑶族自治县电台广播中心app 襄汾县安全宣传app 固镇县出口管理app

本站 2 月 25 日消息,今日人工智能公司 Anthropic 宣布推出其首款“混合推理模型”——Claude 3.7 Sonnet。该模型可以解决更复杂的问题,并在数学和编码等领域中性能超过了以前的模型。

Anthropic公司表示,这是其有史以来“最智能”的 AI 模型,称这种“混合型”模型同时具备“推理模式”(停下来思考复杂答案)与传统模式(实时生成答案)的能力,并表示该模型是市面上唯一的此类“混合”模型。

本站注意到,除了新模型外,Anthropic 还发布了其“自主性”编程工具 Claude Code 的“有限研究预览版”。尽管 Anthropic 已经为如 Cursor 等人工智能编程工具提供支持,但此次推出的 Claude Code 被定位为一个“积极的合作伙伴”,它能够搜索和阅读代码、编辑文件、编写和运行测试、将代码提交到 GitHub,并使用命令行工具。

从本周一开始,用户可以在 Claude 应用程序中使用 Claude 3.7 Sonnet,开发者也可以通过 Anthropic 的 API、亚马逊 Bedrock 和谷歌云的 Vertix AI 获取该模型。其运行成本与前代产品 3.5 Sonnet 相同,输入每百万 token 收费 3 美元,输出每百万 token 收费 15 美元。

目前,OpenAI 等公司提供独立的推理模型,但 Anthropic 产品研究主管 Dianne Penn 表示,公司希望简化使用模型的体验。她指出:“我们从根本上认为,推理是人工智能的一个特征,而不是一个完全独立的事物。”她还提到,Claude 在回答简单问题如“现在几点了?”和应对更复杂的提示,例如“规划一个为期两周的意大利之旅,并考虑 3 月下旬的天气”时,回应速度差异不大。

Dianne Penn 称,Claude 3.7 Sonnet 在“自主性编程”、金融和法律任务上的表现明显优于前代产品。尽管该模型仍不具备实时网络搜索功能,但其知识截止日期为 2024 年 10 月,比其他模型更新。此外,Anthropic 还允许开发者通过其“草稿纸”功能指导模型的“思考”方式,甚至可以精确控制模型的响应时间。Anthropic 产品副总裁 Michael Gerstenhaber 表示:“有时开发者只需要明确指出,回答这个问题不应超过 200 毫秒。”他认为这是产品决策的一部分。

在 Anthropic 内部,员工已利用 Claude 3.7 Sonnet 完成前端网站设计、交互式游戏开发等任务。Penn 透露,该模型甚至能通过反复构建和编辑测试用例,支持长达 45 分钟的编码工作。她还提到,公司通过将模型的 API 映射到游戏控制器方案,测试模型在一款经典《宝可梦》电子游戏中的表现。结果显示,前代 Claude 3.5 Sonnet 无法走出游戏初期的帕雷特镇,而 3.7 版本成功击败了多个道馆馆主。

目前,Anthropic 凭借 Claude 3.7 Sonnet 的性能提升再次处于领先地位。该模型的发布也表明,行业正朝着一个模型能够完成所有任务的未来迈进,而非提供独立的推理模型。

相关文章