302.AI | 特色专栏 由302.AI团队及业内专家组撰稿,希望用最通俗的文字,揭示复杂技术背后的简单本质。

  • 302.AI 基准实验室 | 自动运镜+原生音效:PixVerse V5跻身AI视频生成模型第一梯队

    2025 年 8 月 27 日,爱诗科技 AISphere 全球同步上线了其最新 AI 视频生成模型 PixVerse V5,并免费开放 96 小时供所有用户使用,在这期间,视频生成、关键帧转场、口型同步、热门模板等全部功能均可无障碍体验。这个活动一举激发了社区用户们的创作热情,不少海外网友纷纷晒出了用 PixVerse V5 与 Nano Banana 共…

    19小时前 基准实验室
    490
  • 302.AI 基准实验室丨AI文档解析:六大模型/工具性能实测,AI真能理解复杂文档么?

    在文档数字化的进程中,我们始终面临一个核心难题:如何让机器真正“理解”一份结构复杂的文档——无论是布满合并单元格的财务报表、公式交织的学术论文,还是版式迥异的商业合同。传统的 OCR 工具往往在此折戟,留下需要大量人工校对的数据残片,反而加重处理负担。 尽管目前行业在文档解析领域已有显著突破,从识别准确率到语义解构深度,模型能力仍在持续提升。可面对层出不穷的…

    4天前 基准实验室
    1350
  • 302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

    昨晚,Google 终于公开了其最新图像生成与编辑模型 gemini-2.5-flash-image-preview——这正是前段时间在 X 上爆火的 Nano Banana。早在 Google 还未出来“认领”时,Nano Banana 就因强大的主体一致性和闪电般的响应速度而广获好评,在社区圈粉无数。 出道即巅峰,此模型一经公开就在 Artificial…

    6天前 基准实验室
    4380
  • 302.AI 新品发布 | AI数字人生成应用上线:告别复杂流程,一站式打造专属虚拟 IP

    回想一下,你在社交平台上刷到过哪些让你眼前一亮的视频博主?TA可能是个知识渊博的专家,也可能是个风趣幽默的带货主播。而当你翻看TA的主页,被那些高质量的视频内容吸引时,有没有想过:这或许并非真人创作,而是来自AI数字人技术的虚拟形象?事实上,目前在互联网上流行的AI数字人作品数量远超你的想象。它们的容貌、声音乃至一举一动,都基本与真人无异,且正在以前所未有的…

    2025 年 8 月 22 日 新品发布
    3650
  • 302.AI 基准实验室丨编程能力超越Claude Opus 4?DeepSeek V3.1最新版本实测

    DeepSeek 昨晚在 Hugging Face 发布了其最新升级模型 DeepSeek-V3.1-Base。这次更新并没有任何预热宣传,甚至没有放上模型卡。唯一已知的信息是:上下文窗口从原有的64k扩展至128k,从网页、App、小程序都可体验这一模型。从上传的模型版本看,模型尺寸达 685B,支持 BF16、F8_E4M3、F32 等张量类型,平衡模型…

    2025 年 8 月 20 日 基准实验室
    9180
  • 302.AI 基准实验室丨从写实人像到超现实插画:快手Kling 2.1生图模型创作实测

    快手Kling AI近期开放了其图像生成模型 Kolors 2.1 的 API 接口,Kolors 2.1 自 7 月官宣发布以来,凭借卓越性能广受用户好评。近日 Artificial Analysis 官方也指出, Kolors 2.1 在图像生成领域的排名迅速跻身第五,表现出强劲势头。 Kolors 2.1 主要具备以下特点: 凭借出色的性价比与稳定的出…

    2025 年 8 月 19 日 基准实验室
    2060
  • 302.AI 赛博月刊丨Vol.8 攻守易形:当开源变成中国主场

    AI 行业大事记 2025 年 8 月 联合出品: Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心 说明: ①本文讨论了 2025 年7月 AI行业的 103 件大事,涵盖模型、图像、视频、音频、3D、机器人、应用、新闻/融资等多个领域。 ② 本文分类中的「模型」均指代语言模型; ③ 本文分类中的「融资」包含了融资、收购、团队成…

    2025 年 8 月 18 日 赛博月刊
    4140
  • 302.AI 基准实验室丨从视觉语言到GUI交互:智谱GLM-4.5V挑战顶级闭源模型实测

    视觉语言大模型(VLM)作为智能系统的核心基础,正在不断从基础的“识别”向更深层的“推理”跃迁。今年上半年,多模态大模型在视觉领域呈现百花齐放之势,各厂商竞相布局。然而,视觉能力的下一站是“推理”——不满足于让模型读图后回答“这是什么”,更需其调用推理能力理解背后的意图与情境。这种对视觉逻辑和上下文的理解能力,既是实现通用人工智能(AGI)的关键一步,也是构…

    2025 年 8 月 15 日 基准实验室
    5381
  • 302.AI 基准实验室丨中文渲染新 SOTA!Qwen-Image 实测:多语言文本全面领先

    复杂文本渲染的准确性,一直是 AI 生图领域长期存在的技术瓶颈。即便顶尖的生图模型,在处理复杂文本时也难免出现乱码现象。就在上周,阿里开源了通义千问系列的首个图像生成基础模型——Qwen-Image,其核心突破便在于卓越的复杂文本渲染能力。 通义千问团队在多个公开基准上对 Qwen-Image 进行了全面评估,公开数据表明其在通用图像生成和图像编辑的所有基准…

    2025 年 8 月 13 日 基准实验室
    5722
  • 302.AI 基准实验室丨FLUX.1 Krea 实测:特立独行的平衡之道,如何破局 AI“塑料感”?

    在 AI 生图技术日趋成熟的当下,”去 AI 感”已成为各大开发者竞相突破的核心战场。Black Forest Lab 向来在拟真度方面持有绝对话语权,从我们往期的实测文章《302.AI 基准实验室丨实测对比 FLUX.1 Kontext 系列模型,“快、稳、准”三点能否问鼎?》当中可以看到,Flux 系列模型在保持主体一致性、画面拟…

    2025 年 8 月 11 日 基准实验室
    5011
Load more posts