gpt-5.1
价格直降 66%,性能仍是天花板?Claude Opus 4.5 这一波“降价打击”让谁慌了?丨302.AI 基准实验室
11月25日,当大模型竞赛的聚光灯还在 GPT-5.1 与 Gemini 3 Pro 之间流转时,Anthropic 携其王炸产品 Claude Opus 4.5 强势回归,并宣称这是目前全球范围内在编程、agents 和计算机使用方面最强大的模型,编程能力超越人类专家。 Claude 系列最引人瞩目的王牌,始终是它在编程领域的统治级表现。在权威的真实世界软…
全能SOTA还是术业专攻?Gemini 3 Pro 深度实测:是 UI 构建的“神”,也是算法推导的“凡人”丨302.AI 基准实验室
说实话,到了 2025 年底这个节点,大家对 AI 的感觉可能都有点“疲惫”了。过去这两年,各家大厂像疯了一样堆参数、拼算力,动不动就是参数翻倍,但日常任务用起来的感觉却大同小异。这种“卷算力”的游戏,多少已经到了边际效应递减的时刻。 但就在昨晚(北京时间11月18日),谷歌如果不声不响地扔出了 Gemini 3.0,这潭死水可能还真就被搅活了。 很多人的记…