Benchmark laboratory
302.AI 基准实验室丨国产大模型新卷王!GLM-4.5 开源登顶,逻辑推理硬刚 Grok 4?
北京时间 7 月 28 日,智谱发布了新一代旗舰模型 GLM-4.5 ,根据 Hugging Face 上的介绍,GLM -4.5 系列模型是专为 Agent 设计的基础模型。GLM-4.5 拥有 3550 亿个总参数,其中 320 亿个活跃参数;而 GLM-4.5-Air 则采用更紧凑的设计,拥有 1060 亿个总参数,其中 120 亿个活跃参数。GLM-…
302.AI 基准实验室丨图像编辑模型标杆之争:不做参数党,FLUX.1 Kontext-Dev对比实测
自今年4月OpenAI的GPT-Image-1横空出世以来,AI图像编辑模型已经从小众技术迅速演变为AIGC爱好者和专业人士的日常必备工具。在这短短几个月内,我们见证了这一领域的爆炸式发展。特别是在今年6月,两款重量级产品的登场彻底改变了游戏规则:Black Forest Labs推出的FLUX.1 Kontext系列模型以及字节跳动Seed团队发布的See…
AI 基准实验室丨Kling V2.0 图像生成模型评测——4月发布的模型,如今是否仍宝刀未老?
在AI图像生成领域,从“能画”到“画得好”,再到“画得惊艳”,技术迭代的速度远超想象。7月10日,快手发布了最新的图像生成模型Kolors 2.1(暂时仍未开放API接口)。在对新版本进行接入测试前,让我们回顾下2025年4月推出的Kling V2.0模型,看看90天前发布的上一代模型,在当下是否依然能与各个顶级模型具有一战之力。 kling 2.0 的主要…
302.AI 基准实验室丨你的“数字灵魂复制人”有多真实?Higgsfield Soul ID 最新体验报告
7月初,302.AI对Higgsfield Soul进行了详细评测,其高度拟真的风格与便捷使用的预设给我们留下了深刻印象,详情可阅读《从街头到秀场:拟真度新皇登基!文生图模型Higgsfield Soul 开箱测评》。而Higgsfield AI 于7月10日推出了名为 Soul ID 的全新功能,其核心在于提供一套高度拟真且具有一致性的个人化虚拟角色生成系…
302.AI 基准实验室丨全球首发亿级参数模型Kimi K2:代码能力测评,是真香还是噱头?
北京时间 7 月 11 日,人工智能领域迎来重磅消息!月之暗面(Moonshot AI)正式发布并开源了其旗舰级大模型 Kimi K2。这款模型采用先进的 MoE(Mixture of Experts)架构,总参数量高达惊人的 1 万亿(1T),激活参数也达到 320 亿(32B),其规模和技术深度令人瞩目。 Kimi K2 的核心优势在于其显著增强的代码能…
302.AI 基准实验室丨全面刷新榜单,“全球最强AI”Grok 4评测:真实实力与局限解析
2025年7月10日,全球AI领域再次迎来一场震撼级的技术革新。埃隆·马斯克旗下的xAI公司,在这一天正式向世界揭开了其最新一代大型语言模型——Grok 4的神秘面纱。xAI大胆宣称Grok 4是“全球最强大AI”,并用一系列令人咋舌的基准测试成绩,强有力地支撑了这一论断。 Grok 4不仅推出了强大的单智能体版本,更带来了突破性的多智能体协作版本Grok …
302.AI 基准实验室丨细节、光影、一致性全面领先!字节跳动SeedEdit 3.0开箱评测
2025 年 6 月 6 日,字节跳动 Seed 团队正式发布图像编辑模型 SeedEdit 3.0。该模型可处理并生成 1K 以上高清图像,在精细且自然地处理编辑区域的同时,还能高保真地维持其他信息。尤其针对图像编辑“哪里改与哪里不改”的取舍,该模型表现出更佳的理解力和权衡力,可用率相应提高。 (越发成熟的AI产品给了用户更多的工作流选择) 市面上与 Se…
302.AI 基准实验室丨从街头到秀场:拟真度新皇登基!文生图模型Higgsfield Soul 开箱测评
北京时间6月26日凌晨,Higgsfield AI 在海外社交媒体平台 X 宣布推出文生图模型 Higgsfield Soul,官方介绍这是一款高端美学照片模型(High Aesthetic Photo Model)。一上线即凭「一键高定时装」与「实时姿态驱动」两大黑科技刷爆社媒。Soul 结合跨模态纹理映射与可控人体骨骼动画,可在数秒内把任何草图或文字 p…
302.AI 基准实验室丨Midjourney v1 Video实测:从静到动,美学天花板地位能否延续?
AI 视频生成的「军备竞赛」再添重磅选手,以图像生成「美学天花板」著称的 Midjourney 正式发布旗下首个视频模型 v1 Video,瞬间点燃行业热情——Twitter/X 相关话题 24 小时内浏览量破亿,技术社区 Hacker News 热榜霸屏超 8 小时,甚至有分析师直言:「这可能是今年最接近‘让普通人用文字拍电影’的一次突破。」 作为 Mid…
302.AI 基准实验室丨 谷歌Veo 3又双叒被国产模型超了?MiniMax-Hailuo-02(海螺 02)实测
6 月 18 日,MiniMax 在开源长上下文推理模型 MiniMax-M1 后不到一个月,又高调推出了全新的视频生成模型 MiniMax-Hailuo-02(“海螺 02”)。与上一代“海螺”相比,Hailuo-02 支持最高 1080P、最长 10 s 的超清视频端到端生成,可直接根据文本或图片提示输出 30 fps 的流畅片段,使 MiniMax 跻…