gpt-5.1

价格直降 66%，性能仍是天花板？Claude Opus 4.5 这一波“降价打击”让谁慌了？丨302.AI 基准实验室

11月25日，当大模型竞赛的聚光灯还在 GPT-5.1 与 Gemini 3 Pro 之间流转时，Anthropic 携其王炸产品 Claude Opus 4.5 强势回归，并宣称这是目前全球范围内在编程、agents 和计算机使用方面最强大的模型，编程能力超越人类专家。 Claude 系列最引人瞩目的王牌，始终是它在编程领域的统治级表现。在权威的真实世界软…
2025 年 11 月 28 日 • 基准实验室
2.6K00
全能SOTA还是术业专攻？Gemini 3 Pro 深度实测：是 UI 构建的“神”，也是算法推导的“凡人”丨302.AI 基准实验室

说实话，到了 2025 年底这个节点，大家对 AI 的感觉可能都有点“疲惫”了。过去这两年，各家大厂像疯了一样堆参数、拼算力，动不动就是参数翻倍，但日常任务用起来的感觉却大同小异。这种“卷算力”的游戏，多少已经到了边际效应递减的时刻。但就在昨晚（北京时间11月18日），谷歌如果不声不响地扔出了 Gemini 3.0，这潭死水可能还真就被搅活了。很多人的记…
2025 年 11 月 19 日 • 基准实验室
8.1K01