Gemini-2.5-pro
全能SOTA还是术业专攻?Gemini 3 Pro 深度实测:是 UI 构建的“神”,也是算法推导的“凡人”丨302.AI 基准实验室
说实话,到了 2025 年底这个节点,大家对 AI 的感觉可能都有点“疲惫”了。过去这两年,各家大厂像疯了一样堆参数、拼算力,动不动就是参数翻倍,但日常任务用起来的感觉却大同小异。这种“卷算力”的游戏,多少已经到了边际效应递减的时刻。 但就在昨晚(北京时间11月18日),谷歌如果不声不响地扔出了 Gemini 3.0,这潭死水可能还真就被搅活了。 很多人的记…
终结“人机感”,MiniMax Speech 2.6 实测:低延迟+全音色复刻颠覆体验丨302.AI 基准实验室
从机械单调的合成音,到略带情感的 AI 助手,AI 语音的竞赛始终聚焦于说得更“快”与更“像”的极限。然而,旧有的标杆正在被颠覆:MiniMax 于 10 月 30 日掷出其最新语音模型Speech 2.6,将端到端延迟一举压缩至 250 毫秒以下,重新定义了实时语音交互的速率标准。在人类日常对话中,自然停顿介于 300-500 毫秒之间,而 250 毫秒更…
Doubao-Seed-Translation翻译模型实测:距离真正的“翻译大师”还有多远?丨302.AI 基准实验室
字节跳动旗下火山引擎于 9 月推出其通用多语言翻译模型 Doubao-Seed-Translation,支持包括中、英、日、韩、德、法等 28 种语言互译,基本覆盖了全球大部分主流语种。官方称模型在中英翻译效果上逼近 Deepseek-R1,而在多语言综合表现上,甚至可以对标顶尖模型 GPT-4o 与 Gemini-2.5-Pro,展现出国际一流的翻译水准。…