GPT-5测评报告!推理编程能力爆表! 发表于 2025-08-12 分类于 免费AI工具 阅读次数: 上两个视频分享了OpenAI刚推出的GPT-5都有哪些亮点,除了统一访问自动判断应该调用哪个模型,最令我振奋的是推理和编程能力的提升,看swe-bench的话得分74.9%,已经超过了昨天跟大家分享的claude最新的opus 4.1的74.5%了。同时应反诈牢陈的请求,准备测评下。废话不多说,直接开干 访问入口