302.AI | 特色专栏 由302.AI团队及业内专家组撰稿,希望用最通俗的文字,揭示复杂技术背后的简单本质。

  • 302.AI 赛博月刊丨Vol.8 攻守易形:当开源变成中国主场

    AI 行业大事记 2025 年 8 月 联合出品: Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心 说明: ①本文讨论了 2025 年7月 AI行业的 103 件大事,涵盖模型、图像、视频、音频、3D、机器人、应用、新闻/融资等多个领域。 ② 本文分类中的「模型」均指代语言模型; ③ 本文分类中的「融资」包含了融资、收购、团队成…

    11小时前 赛博月刊
    360
  • 302.AI 基准实验室丨从视觉语言到GUI交互:智谱GLM-4.5V挑战顶级闭源模型实测

    视觉语言大模型(VLM)作为智能系统的核心基础,正在不断从基础的“识别”向更深层的“推理”跃迁。今年上半年,多模态大模型在视觉领域呈现百花齐放之势,各厂商竞相布局。然而,视觉能力的下一站是“推理”——不满足于让模型读图后回答“这是什么”,更需其调用推理能力理解背后的意图与情境。这种对视觉逻辑和上下文的理解能力,既是实现通用人工智能(AGI)的关键一步,也是构…

    3天前 基准实验室
    1551
  • 302.AI 基准实验室丨中文渲染新 SOTA!Qwen-Image 实测:多语言文本全面领先

    复杂文本渲染的准确性,一直是 AI 生图领域长期存在的技术瓶颈。即便顶尖的生图模型,在处理复杂文本时也难免出现乱码现象。就在上周,阿里开源了通义千问系列的首个图像生成基础模型——Qwen-Image,其核心突破便在于卓越的复杂文本渲染能力。 通义千问团队在多个公开基准上对 Qwen-Image 进行了全面评估,公开数据表明其在通用图像生成和图像编辑的所有基准…

    5天前 基准实验室
    2890
  • 302.AI 基准实验室丨FLUX.1 Krea 实测:特立独行的平衡之道,如何破局 AI“塑料感”?

    在 AI 生图技术日趋成熟的当下,”去 AI 感”已成为各大开发者竞相突破的核心战场。Black Forest Lab 向来在拟真度方面持有绝对话语权,从我们往期的实测文章《302.AI 基准实验室丨实测对比 FLUX.1 Kontext 系列模型,“快、稳、准”三点能否问鼎?》当中可以看到,Flux 系列模型在保持主体一致性、画面拟…

    2025 年 8 月 11 日 基准实验室
    2670
  • 302.AI 基准实验室丨GPT-5评测:没能炸场,却精准打脸了竞品:便宜、能打,还不装

    尘埃落定,当地时间 8 月 7 日,OpenAI 终于发布了最新的旗舰 AI 模型 GPT-5。OpenAI 宣称,GPT-5 是其迄今为止最智能、最快、最实用的模型,在编码、数学、写作、健康、视觉感知等领域均展现出卓越的性能。首席执行官 Sam Altman 将 GPT-5 形容为一次“重大升级”,称与其对话“就像在与某个领域的博士级专家交流”。 GPT-…

    2025 年 8 月 8 日 基准实验室
    8641
  • 302.AI 基准实验室丨开源新SOTA? Open AI GPT-OSS系列模型对决国产开源模型评测

    2025 年 8 月 5 日,OpenAI 突袭发布了两款全新的开源推理模型——gpt-oss-120b 和 gpt-oss-20b。这是 OpenAI 自 2019 年 开源 GPT-2 以来,时隔 6 年首次重返开源生态。 本次开源的 gpt-oss 系列包含两个高性能版本,均采用混合专家架构(MoE) 与 Apache 2.0 开源许可,支持自由修改、…

    2025 年 8 月 6 日 基准实验室
    1.5K0
  • 302.AI 基准实验室丨指令的艺术:深度评测JSON格式与自然语义提示词对于AI创作的影响

    一、引言 如今这时代,你打开电脑,随手敲下几行字,十来秒它就给你变出一幅栩栩如生的图像,或是一段流畅的视频,不带卡顿够高清的那种。这事以前听着像是魔术,现在已经成了日常。AI这几年在生成图像和视频方面飙得飞快,背后推动它起飞的燃料,其中一个重要因素就是提示词——Prompt。 你可能没太注意过,就是你跟AI说话的形式。别觉得这东西不起眼,它对最终生成效果的影…

    2025 年 8 月 5 日 基准实验室
    2620
  • 302.AI 基准实验室 | 开源之路更远行:Wan 2.2对决国产顶级视频模型评测

    7 月 28 日,阿里通义正式开源了其视频生成模型——通义万相 Wan2.2,该模型采用创新的 MoE(Mixture of Experts)架构,由高噪专家模型和低噪专家模型组成,能够根据去噪时间步进行专家模型划分,从而生成更高质量的视频内容。 Wan2.2 在 Wan2.1 的基础上实现了生成质量和模型能力的显著提升,其技术突破主要体现在三大核心领域:混…

    2025 年 8 月 4 日 基准实验室
    5790
  • 302.AI 基准实验室丨国产大模型新卷王!GLM-4.5 开源登顶,逻辑推理硬刚 Grok 4?

    北京时间 7 月 28 日,智谱发布了新一代旗舰模型 GLM-4.5 ,根据 Hugging Face 上的介绍,GLM -4.5 系列模型是专为 Agent 设计的基础模型。GLM-4.5 拥有 3550 亿个总参数,其中 320 亿个活跃参数;而 GLM-4.5-Air 则采用更紧凑的设计,拥有 1060 亿个总参数,其中 120 亿个活跃参数。GLM-…

    2025 年 7 月 31 日 基准实验室
    4200
  • 302.AI 实战教程丨轻松生成“盗梦空间”?302.AI 教你两步玩转家装盲盒视频

    当家居设计遇上AI爆炸盲盒,网友们的创意简直炸裂!7月中旬,社交平台上被一波“AI魔改空间”视频刷屏,幕后的功臣正是新一代文生视频神器——Veo 3。想象一下,你北欧极简风的卧室只需短短几秒,秒变三丽鸥限定皮肤,家具像盲盒爆破一样自动组装、花式变形,下一秒整个空间直接升级成相应主题的样板间。这种超现实的视觉体验,简直比诺兰的《盗梦空间》还离谱,网友直呼“家装…

    2025 年 7 月 30 日 实战教程
    2770
Load more posts