前两天我们分享的谷歌 Gemini 3才大杀四方!今天 Anthropic 就祭出 Claude Opus 4.5 来夺回AI编程老大的皇冠。它不仅是 Claude 系列的又一次飞跃,更凭借其在多项关键基准测试中的卓越表现,一举登上编程、智能体和计算机使用(也就是computer use)能力领域的巅峰。Opus 4.5 在业界公认难度极高的 Swebench Verified 编程基准测试中,以超过 80% 的高分领跑,并在 OSWorld 和 Agentic Tool Use 等测试中同样位居榜首,充分证明了其在复杂任务执行、代码自动修复和系统级操作方面的超凡实力…
展开更多