LLM
302.AI 基准实验室丨全球首发亿级参数模型Kimi K2:代码能力测评,是真香还是噱头?
北京时间 7 月 11 日,人工智能领域迎来重磅消息!月之暗面(Moonshot AI)正式发布并开源了其旗舰级大模型 Kimi K2。这款模型采用先进的 MoE(Mixture of Experts)架构,总参数量高达惊人的 1 万亿(1T),激活参数也达到 320 亿(32B),其规模和技术深度令人瞩目。 Kimi K2 的核心优势在于其显著增强的代码能…
302.AI 基准实验室丨全面刷新榜单,“全球最强AI”Grok 4评测:真实实力与局限解析
2025年7月10日,全球AI领域再次迎来一场震撼级的技术革新。埃隆·马斯克旗下的xAI公司,在这一天正式向世界揭开了其最新一代大型语言模型——Grok 4的神秘面纱。xAI大胆宣称Grok 4是“全球最强大AI”,并用一系列令人咋舌的基准测试成绩,强有力地支撑了这一论断。 Grok 4不仅推出了强大的单智能体版本,更带来了突破性的多智能体协作版本Grok …
302.AI 赛博月刊丨Vol.7 90天定律:从落后到突围,国产AI的崛起周期
AI 行业大事记 2025 年 7 月 联合出品: Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心 说明: ① 本期月刊收录 AI 行业大事共 106 件; ② 本文分类中的「模型」均指代语言模型; ③ 本文分类中的「融资」包含了融资、收购、团队成员吸收等多种方式; ④ 完整版内容欢迎前往 WaytoAGI …
302.AI 基准实验室丨三大最新语言模型:Gemini/Doubao/Minimax 高考数学与游戏编程实战测评
6月,各大模型厂商如同上了“发条”,新品发布纷至沓来。 6月11日,Force 2025 原动力大会上,火山引擎正式发布豆包大模型 1.6 版(Doubao-Seed-1.6)。该系列中包含了三个主要版本:标准版 Doubao-Seed-1.6、深度思考强化版 Doubao-Seed-1.6-thinking 以及极速版 Doubao-Seed-1.6-fl…
302.AI 赛博月刊丨Vol.6 围城:模型困局、垂类竞速与 Agent 逐鹿
AI 行业大事记 2025 年 6 月 联合出品: Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心 说明: ① 本期月刊期次 2506(2025年6月),整理和分析的是上个月(5月)AI 领域里有重大意义和影响的各类事件; ② 本期月刊共收录 101 条内容; ③ 月刊分类中的「…
新版 DeepSeek-R1-0528 对比旧版区别在哪?速看对比实测结果 | 302.AI 基准实验室
北京时间 5 月 28 日晚,DeepSeek 在官方社群推送了更新通知。 5 月 29 日 DeepSeek 正式在社媒平台宣布 DeepSeek R1 模型已完成小版本升级,当前版本更新为 DeepSeek-R1-0528 Hugging Face模型榜登顶 根据 DeepSeek 官方重点信息提炼: 更新后的 R1 模型在数学、编程与通用逻辑等多个基准…
302.AI 基准实验室丨字节跳动开源 BAGEL 对标 GPT-Image-1,实测结果令人大跌眼镜!
2025年5月20日,字节跳动团队于 Hugging Face 平台推出了全新开源的统一多模态模型:BAGEL 。模型一经发布,不仅迅速登上Hugging Face趋势榜,同时引发海内外热议。 Hugging Face登顶 海外AI从业者评价 BAGEL 基于 Qwen2.5-7B-Instruct 和 siglip-so400m-14-384-flash-…
Claude 4 系列最新对比测评,推理退步前端编程增强?| 302.AI 基准实验室
美东时间5月22日周四,Anthropic在公司首届”Code with Claude”开发者大会上推出了 Claude 4 系列的两款全新模型:Claude Opus 4和Claude Sonnet 4。 据了解,Claude Opus 4 和 Sonnet 4 都是混合推理模型,同时支持 Extended thinking(扩展推…
302.AI 基准实验室 | 大模型排行榜第二!Gemini-2.5-flash-preview-05-20全方位对比测评
北京时间 5 月 21 日,谷歌在 I/O 2025大会上带来了新模型:gemini-2.5-flash-preview-05-20。 gemini-2.5-flash-preview-05-20 是专为速度和低成本而设计,更新后的版本在推理、多模态、代码和长上下文等关键基准上都得到了改进,同时使用的 token 减少了 20-30%。 在lmarena.a…
302.AI 赛博月刊丨Vol.5 神仙打架,Manus 之后的新玩家们
AI 行业大事记 2025 年 5 月 联合出品: Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心 说明: ① 本期月刊收录 AI 行业大事共 104 件; ② 本文分类中的【模型】均指代语言模型; ③ 本文 Agent、代理、智能体等词语的含义相同; ④ 一般产品接入 MCP 不再单独列出,头部公…