LLM

302.AI 基准实验室丨全球首发亿级参数模型Kimi K2：代码能力测评，是真香还是噱头？

北京时间 7 月 11 日，人工智能领域迎来重磅消息！月之暗面（Moonshot AI）正式发布并开源了其旗舰级大模型 Kimi K2。这款模型采用先进的 MoE（Mixture of Experts）架构，总参数量高达惊人的 1 万亿（1T），激活参数也达到 320 亿（32B），其规模和技术深度令人瞩目。 Kimi K2 的核心优势在于其显著增强的代码能…
2025 年 7 月 15 日 • 基准实验室
5.2K20
302.AI 基准实验室丨全面刷新榜单，“全球最强AI”Grok 4评测：真实实力与局限解析

2025年7月10日，全球AI领域再次迎来一场震撼级的技术革新。埃隆·马斯克旗下的xAI公司，在这一天正式向世界揭开了其最新一代大型语言模型——Grok 4的神秘面纱。xAI大胆宣称Grok 4是“全球最强大AI”，并用一系列令人咋舌的基准测试成绩，强有力地支撑了这一论断。 Grok 4不仅推出了强大的单智能体版本，更带来了突破性的多智能体协作版本Grok …
2025 年 7 月 12 日 • 基准实验室
4.3K20
302.AI 赛博月刊丨Vol.7 90天定律：从落后到突围，国产AI的崛起周期

AI 行业大事记 2025 年 7 月联合出品： Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心说明: ① 本期月刊收录 AI 行业大事共 106 件； ② 本文分类中的「模型」均指代语言模型； ③ 本文分类中的「融资」包含了融资、收购、团队成员吸收等多种方式； ④ 完整版内容欢迎前往 WaytoAGI …
2025 年 7 月 8 日 • 赛博月刊
2.0K30
302.AI 基准实验室丨三大最新语言模型：Gemini/Doubao/Minimax 高考数学与游戏编程实战测评

6月，各大模型厂商如同上了“发条”，新品发布纷至沓来。 6月11日，Force 2025 原动力大会上，火山引擎正式发布豆包大模型 1.6 版（Doubao-Seed-1.6）。该系列中包含了三个主要版本：标准版 Doubao-Seed-1.6、深度思考强化版 Doubao-Seed-1.6-thinking 以及极速版 Doubao-Seed-1.6-fl…
2025 年 6 月 19 日 • 基准实验室
3.7K30
302.AI 赛博月刊丨Vol.6 围城：模型困局、垂类竞速与 Agent 逐鹿

AI 行业大事记 2025 年 6 月联合出品： Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心说明: ① 本期月刊期次 2506（2025年6月），整理和分析的是上个月（5月）AI 领域里有重大意义和影响的各类事件； ② 本期月刊共收录 101 条内容； ③ 月刊分类中的「…
2025 年 6 月 17 日 • 赛博月刊
2.1K10
新版 DeepSeek-R1-0528 对比旧版区别在哪？速看对比实测结果 | 302.AI 基准实验室

北京时间 5 月 28 日晚，DeepSeek 在官方社群推送了更新通知。 5 月 29 日 DeepSeek 正式在社媒平台宣布 DeepSeek R1 模型已完成小版本升级，当前版本更新为 DeepSeek-R1-0528 Hugging Face模型榜登顶根据 DeepSeek 官方重点信息提炼：更新后的 R1 模型在数学、编程与通用逻辑等多个基准…
2025 年 5 月 30 日 • 基准实验室
5.4K140
302.AI 基准实验室丨字节跳动开源 BAGEL 对标 GPT-Image-1，实测结果令人大跌眼镜！

2025年5月20日，字节跳动团队于 Hugging Face 平台推出了全新开源的统一多模态模型：BAGEL 。模型一经发布，不仅迅速登上Hugging Face趋势榜，同时引发海内外热议。 Hugging Face登顶海外AI从业者评价 BAGEL 基于 Qwen2.5-7B-Instruct 和 siglip-so400m-14-384-flash-…
2025 年 5 月 29 日 • 基准实验室
2.5K120
Claude 4 系列最新对比测评，推理退步前端编程增强？| 302.AI 基准实验室

美东时间5月22日周四，Anthropic在公司首届”Code with Claude”开发者大会上推出了 Claude 4 系列的两款全新模型：Claude Opus 4和Claude Sonnet 4。据了解，Claude Opus 4 和 Sonnet 4 都是混合推理模型，同时支持 Extended thinking（扩展推…
2025 年 5 月 23 日 • 基准实验室
14.2K2450
302.AI 基准实验室 | 大模型排行榜第二！Gemini-2.5-flash-preview-05-20全方位对比测评

北京时间 5 月 21 日，谷歌在 I/O 2025大会上带来了新模型：gemini-2.5-flash-preview-05-20。 gemini-2.5-flash-preview-05-20 是专为速度和低成本而设计，更新后的版本在推理、多模态、代码和长上下文等关键基准上都得到了改进，同时使用的 token 减少了 20-30%。在lmarena.a…
2025 年 5 月 22 日 • 基准实验室
5.1K1670
302.AI 赛博月刊丨Vol.5 神仙打架，Manus 之后的新玩家们

AI 行业大事记 2025 年 5 月联合出品： Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心说明: ① 本期月刊收录 AI 行业大事共 104 件； ② 本文分类中的【模型】均指代语言模型； ③ 本文 Agent、代理、智能体等词语的含义相同； ④ 一般产品接入 MCP 不再单独列出，头部公…
2025 年 5 月 1 日 • 赛博月刊
1.5K10

3 / 11
1
2
3
4
5
6