AI产品狙击手

专注于大语言模型LLM,文生图模型Stable Diffusion, 视频生成模型等免费AI工具的分享和应用,助你掌握最前沿的AI技术

0%

GPT-5测评报告!推理编程能力爆表!

上两个视频分享了OpenAI刚推出的GPT-5都有哪些亮点,除了统一访问自动判断应该调用哪个模型,最令我振奋的是推理和编程能力的提升,看swe-bench的话得分74.9%,已经超过了昨天跟大家分享的claude最新的opus 4.1的74.5%了。同时应反诈牢陈的请求,准备测评下。废话不多说,直接开干