基准实验室
302.AI 基准实验室丨FLUX.1 Krea 实测:特立独行的平衡之道,如何破局 AI“塑料感”?
在 AI 生图技术日趋成熟的当下,”去 AI 感”已成为各大开发者竞相突破的核心战场。Black Forest Lab 向来在拟真度方面持有绝对话语权,从我们往期的实测文章《302.AI 基准实验室丨实测对比 FLUX.1 Kontext 系列模型,“快、稳、准”三点能否问鼎?》当中可以看到,Flux 系列模型在保持主体一致性、画面拟…
302.AI 基准实验室丨GPT-5评测:没能炸场,却精准打脸了竞品:便宜、能打,还不装
尘埃落定,当地时间 8 月 7 日,OpenAI 终于发布了最新的旗舰 AI 模型 GPT-5。OpenAI 宣称,GPT-5 是其迄今为止最智能、最快、最实用的模型,在编码、数学、写作、健康、视觉感知等领域均展现出卓越的性能。首席执行官 Sam Altman 将 GPT-5 形容为一次“重大升级”,称与其对话“就像在与某个领域的博士级专家交流”。 GPT-…
302.AI 基准实验室丨开源新SOTA? Open AI GPT-OSS系列模型对决国产开源模型评测
2025 年 8 月 5 日,OpenAI 突袭发布了两款全新的开源推理模型——gpt-oss-120b 和 gpt-oss-20b。这是 OpenAI 自 2019 年 开源 GPT-2 以来,时隔 6 年首次重返开源生态。 本次开源的 gpt-oss 系列包含两个高性能版本,均采用混合专家架构(MoE) 与 Apache 2.0 开源许可,支持自由修改、…
302.AI 基准实验室丨指令的艺术:深度评测JSON格式与自然语义提示词对于AI创作的影响
一、引言 如今这时代,你打开电脑,随手敲下几行字,十来秒它就给你变出一幅栩栩如生的图像,或是一段流畅的视频,不带卡顿够高清的那种。这事以前听着像是魔术,现在已经成了日常。AI这几年在生成图像和视频方面飙得飞快,背后推动它起飞的燃料,其中一个重要因素就是提示词——Prompt。 你可能没太注意过,就是你跟AI说话的形式。别觉得这东西不起眼,它对最终生成效果的影…
302.AI 基准实验室 | 开源之路更远行:Wan 2.2对决国产顶级视频模型评测
7 月 28 日,阿里通义正式开源了其视频生成模型——通义万相 Wan2.2,该模型采用创新的 MoE(Mixture of Experts)架构,由高噪专家模型和低噪专家模型组成,能够根据去噪时间步进行专家模型划分,从而生成更高质量的视频内容。 Wan2.2 在 Wan2.1 的基础上实现了生成质量和模型能力的显著提升,其技术突破主要体现在三大核心领域:混…
302.AI 基准实验室丨国产大模型新卷王!GLM-4.5 开源登顶,逻辑推理硬刚 Grok 4?
北京时间 7 月 28 日,智谱发布了新一代旗舰模型 GLM-4.5 ,根据 Hugging Face 上的介绍,GLM -4.5 系列模型是专为 Agent 设计的基础模型。GLM-4.5 拥有 3550 亿个总参数,其中 320 亿个活跃参数;而 GLM-4.5-Air 则采用更紧凑的设计,拥有 1060 亿个总参数,其中 120 亿个活跃参数。GLM-…
302.AI 基准实验室丨图像编辑模型标杆之争:不做参数党,FLUX.1 Kontext-Dev对比实测
自今年4月OpenAI的GPT-Image-1横空出世以来,AI图像编辑模型已经从小众技术迅速演变为AIGC爱好者和专业人士的日常必备工具。在这短短几个月内,我们见证了这一领域的爆炸式发展。特别是在今年6月,两款重量级产品的登场彻底改变了游戏规则:Black Forest Labs推出的FLUX.1 Kontext系列模型以及字节跳动Seed团队发布的See…
AI 基准实验室丨Kling V2.0 图像生成模型评测——4月发布的模型,如今是否仍宝刀未老?
在AI图像生成领域,从“能画”到“画得好”,再到“画得惊艳”,技术迭代的速度远超想象。7月10日,快手发布了最新的图像生成模型Kolors 2.1(暂时仍未开放API接口)。在对新版本进行接入测试前,让我们回顾下2025年4月推出的Kling V2.0模型,看看90天前发布的上一代模型,在当下是否依然能与各个顶级模型具有一战之力。 kling 2.0 的主要…
302.AI 基准实验室丨你的“数字灵魂复制人”有多真实?Higgsfield Soul ID 最新体验报告
7月初,302.AI对Higgsfield Soul进行了详细评测,其高度拟真的风格与便捷使用的预设给我们留下了深刻印象,详情可阅读《从街头到秀场:拟真度新皇登基!文生图模型Higgsfield Soul 开箱测评》。而Higgsfield AI 于7月10日推出了名为 Soul ID 的全新功能,其核心在于提供一套高度拟真且具有一致性的个人化虚拟角色生成系…
302.AI 基准实验室丨全球首发亿级参数模型Kimi K2:代码能力测评,是真香还是噱头?
北京时间 7 月 11 日,人工智能领域迎来重磅消息!月之暗面(Moonshot AI)正式发布并开源了其旗舰级大模型 Kimi K2。这款模型采用先进的 MoE(Mixture of Experts)架构,总参数量高达惊人的 1 万亿(1T),激活参数也达到 320 亿(32B),其规模和技术深度令人瞩目。 Kimi K2 的核心优势在于其显著增强的代码能…