Gemini-2.5-pro

全能SOTA还是术业专攻？Gemini 3 Pro 深度实测：是 UI 构建的“神”，也是算法推导的“凡人”丨302.AI 基准实验室

说实话，到了 2025 年底这个节点，大家对 AI 的感觉可能都有点“疲惫”了。过去这两年，各家大厂像疯了一样堆参数、拼算力，动不动就是参数翻倍，但日常任务用起来的感觉却大同小异。这种“卷算力”的游戏，多少已经到了边际效应递减的时刻。但就在昨晚（北京时间11月18日），谷歌如果不声不响地扔出了 Gemini 3.0，这潭死水可能还真就被搅活了。很多人的记…
2025 年 11 月 19 日 • 基准实验室
9.0K01
终结“人机感”，MiniMax Speech 2.6 实测：低延迟+全音色复刻颠覆体验丨302.AI 基准实验室

从机械单调的合成音，到略带情感的 AI 助手，AI 语音的竞赛始终聚焦于说得更“快”与更“像”的极限。然而，旧有的标杆正在被颠覆：MiniMax 于 10 月 30 日掷出其最新语音模型Speech 2.6，将端到端延迟一举压缩至 250 毫秒以下，重新定义了实时语音交互的速率标准。在人类日常对话中，自然停顿介于 300-500 毫秒之间，而 250 毫秒更…
2025 年 11 月 3 日 • 基准实验室
2.3K10
Doubao-Seed-Translation翻译模型实测：距离真正的“翻译大师”还有多远？丨302.AI 基准实验室

字节跳动旗下火山引擎于 9 月推出其通用多语言翻译模型 Doubao-Seed-Translation，支持包括中、英、日、韩、德、法等 28 种语言互译，基本覆盖了全球大部分主流语种。官方称模型在中英翻译效果上逼近 Deepseek-R1，而在多语言综合表现上，甚至可以对标顶尖模型 GPT-4o 与 Gemini-2.5-Pro，展现出国际一流的翻译水准。…
2025 年 10 月 27 日 • 基准实验室
2.8K10

Gemini-2.5-pro

全能SOTA还是术业专攻？Gemini 3 Pro 深度实测：是 UI 构建的“神”，也是算法推导的“凡人”丨302.AI 基准实验室

终结“人机感”，MiniMax Speech 2.6 实测：低延迟+全音色复刻颠覆体验丨302.AI 基准实验室

Doubao-Seed-Translation翻译模型实测：距离真正的“翻译大师”还有多远？丨302.AI 基准实验室