302.AI

Kimi K2 Thinking actual measurement: Complex reasoning is already very useful,深度编程尚待提升丨302.AI Benchmark laboratory

In the summer of 2025, when the main line of the large-scale model competition has shifted from a simple parameter scale to a deeper “intelligent intelligence” (Agentic Intelligence), a name detonated the entire open source community like thunder-Kimi K2. This groundbreaking open source big language model released by Moonshot AI on July 11, 2025 is not only the first big model in the industry to claim to reach trillion parameters, the total number of parameters is as high as a staggering 1.04 trillion, and more importantly…
November 7, 2025 • Benchmark laboratory
8.0K11
解锁沉浸式翻译的终极形态，自由调用302.AI各大顶尖大模型丨302.AI 实战教程

提起具备AI翻译功能的浏览器插件，相信许多中国用户已经对“沉浸式翻译”（Immersive Translate）这款神器耳熟能详了。这个插件是由中国独立开发者Owen主导的个人项目（GitHub ID：immersive-translate），在2023年首次亮相后，很快凭借其出色的用户体验和口碑传播，成为浏览器扩展领域的黑马，迅速走红。沉浸式翻译的核心理…
2025 年 11 月 5 日 • Practical tutorial
1.8K00
终结“人机感”，MiniMax Speech 2.6 实测：低延迟+全音色复刻颠覆体验丨302.AI 基准实验室

从机械单调的合成音，到略带情感的 AI 助手，AI 语音的竞赛始终聚焦于说得更“快”与更“像”的极限。然而，旧有的标杆正在被颠覆：MiniMax 于 10 月 30 日掷出其最新语音模型Speech 2.6，将端到端延迟一举压缩至 250 毫秒以下，重新定义了实时语音交互的速率标准。在人类日常对话中，自然停顿介于 300-500 毫秒之间，而 250 毫秒更…
2025 年 11 月 3 日 • Benchmark laboratory
1.9K10
当对手已冲入2.5时代，Minimax Hailuo 2.3却在踩倒车? 丨302.AI 基准实验室

在我们 9 月末的评测文章《国产AI视频“2.5时代”首战：Wan2.5的“电影感”与Kling 2.5的“稳定美学”，能否击败Veo 3？》中，曾提到国产 AI 视频模型正不约而同迈入 2.5 时代，而在一个多月后的 10 月 28 日，这一阵营中的又一员大将——来自 MiniMax 的 Hailuo 也正式迎来升级，推出 2.3 版本。 Hailuo 2…
2025 年 10 月 31 日 • Benchmark laboratory
1.5K10
卷不动全能冠军？MiniMax-M2：用一半的力气，拿下最值钱的阵地丨302.AI 基准实验室

MiniMax 日前正式开源了其专为编程任务与 Agent 工作流优化设计的大模型 MiniMax-M2。该模型采用 MoE 混合专家架构，官方称其为“小模型”，是因为仅凭 100 亿激活参数，即可实现媲美顶尖模型的端到端工具调用能力，而其轻量级形态使得部署和扩展变得比以往更加轻松。 MiniMax M2 定位明确，旨在成为 AI 编程与 Agent 开发领…
2025 年 10 月 29 日 • Benchmark laboratory
4.5K11
Doubao-Seed-Translation翻译模型实测：距离真正的“翻译大师”还有多远？丨302.AI 基准实验室

字节跳动旗下火山引擎于 9 月推出其通用多语言翻译模型 Doubao-Seed-Translation，支持包括中、英、日、韩、德、法等 28 种语言互译，基本覆盖了全球大部分主流语种。官方称模型在中英翻译效果上逼近 Deepseek-R1，而在多语言综合表现上，甚至可以对标顶尖模型 GPT-4o 与 Gemini-2.5-Pro，展现出国际一流的翻译水准。…
2025 年 10 月 27 日 • Benchmark laboratory
2.3K10
Sonnet 4 平替？Claude Haiku 4.5 实测杀疯了：性能不输，价格砍半丨302.AI 基准实验室

距 Claude Sonnet 4 问鼎业界编程翘楚五个月后，Anthropic 再度官宣发布其 Claude 家族轻量级新作——Claude Haiku 4.5，并宣称该模型在编码性能上已媲美 Sonnet 4，而价格仅为后者的三分之一，速度更是提升一倍以上，堪称一款极具竞争力的 Sonnet 4 平替。 Anthropic 官方抛出的数据也直观地力证了 …
2025 年 10 月 24 日 • Benchmark laboratory
2.6K00
Topaz Labs评测：当“修复式”专业工具遇上“生成式”大模型，AI修图的未来将走向何方？丨302.AI 基准实验室

相信很多影像工作者近些年对 Topaz Labs 这家公司已不陌生，和一众 2024 年后围绕AI做概念就开始融资的新玩家不同，Topaz Labs 是在AI浪潮来临之前，就已经把专业技能点点满的硬核老兵——它用一系列真实可用的模型工具，在图像修复、局部放大、细节增强、去噪、插帧和视频补帧等领域打下了坚实口碑：模糊镜头能拉清晰、低分辨率素材能补成4K，尤其是…
2025 年 10 月 22 日 • Benchmark laboratory
1.8K11
不止于形，更在于神——Vidu Q2 实测：“演技派”领跑AI视频内卷新方向丨302.AI 基准实验室

随着 AI 视频生成技术从基础的提示词理解迈向电影级画面创作，模型的进化方向已不再局限于画质本身，而是延伸至具备导演思维的运镜逻辑与对用户深层意图的感知能力。“电影级”，正成为新一代 AI 视频模型的核心标签。在九月末密集发布的 AI 视频模型中，Wan2.5 与 Sora 2 凭借音画同步能力的突破，将 AI 视频的叙事质感推向一个新高度。紧随其后，生数…
2025 年 10 月 20 日 • Benchmark laboratory
2.6K00
Veo 3.1评测：Google的0.1次迭代能否撬动Sora 2的王座？丨302.AI 基准实验室

10月16日，就在AI视频领域的军备竞赛仍聚焦于 Sora 2 音画同步所加入的高拟真度赛道时，Google 经过数日网上泄密与舆论发酵后，突然强势切入战局，公开释出其视频生成模型的全新迭代——Veo 3.1，此次升级旨在系统性地提升视频生成的几大重要维度：导演级的叙事控制能力、电影级的音频质量，以及更高的场景真实感。Veo 3.1的正式推出，无疑进一步拉高…
2025 年 10 月 16 日 • Benchmark laboratory
1.9K00

4 / 27
1
2
3
4
5
6