AI Shengtu
下一个爆款 AI 应用,也许来自于你:无需代码基础,轻松复刻热门3D影棚应用 | 302.AI 实战教程
在刚过去的周末,AIGC社区又出现了一款吸引眼球的应用:基于 Qwen Image Edit 2511 底层模型打造的“3D CameraControl(3D 相机控制)” 应用,陆续进入广大用户的视野,引发大量赞叹:我们终于可以像操作相机一样,在 AI 的世界里自由运镜了。 长久以来,AI 绘画一直存在一个反直觉的门槛:为了调整一个角度,我们需要在脑中先建…
AI图像模型2025年度测评:从视觉惊艳的玩具走向商业交付的生产力工具 | 302.AI 基准实验室
I. 引言:从“惊艳”走向“精准”的变革之年 如果说2023年是AI绘画的“奇点”,2024年是百花齐放的“探索期”,那么刚刚过去的2025年,无疑是AI图像生成技术真正从“玩具”向“工具”蜕变的一年。 站在2026年初的回望点上,我们不得不承认,行业格局的洗牌速度远超预期。在半年前,我们在半年度的测评中还在讨论“哪张图更拟真,具有摄影的质感”,而到了今天,…
Qwen-Image-2512 实测:阿里开源闭源图像模型同台竞技,结果意想不到 | 302.AI 基准实验室
阿里通义团队于 12 月最后一天开源了 Qwen-Image-2512。作为对去年 8 月发布的 Qwen-Image 的全面进化,新版本致力于在图像真实性、纹理细腻度与复杂图文渲染三大维度实现跨越式进步,让生成内容无限贴近真实世界。 去“AI 味”已经是 AI 生图领域老生常谈的一个话题,此次 2512 版本不仅显著削弱了生成图片的 AI 感,更在人物肌肤…
把图片像PSD一样拆开?Qwen-Image-Layered:找到了AI修图的新路,却还没跨过“商用”门槛丨302.AI 基准实验室
阿里通义团队于 12 月 19 日推出了其新一代图像生成模型 Qwen-lmage-Layered。新模型采用自研创新架构,可将图片“拆解”成多个图层。这种分层表示赋予了图像内在的可编辑性:每个图层都可以独立操作,而不会影响其他内容。 Qwen-lmage-Layered 的核心突破在于其革命性的“智能分层”能力。与传统的、直接生成一张平面像素图的模型不同,…
图像模型SOTA易主?GPT-Image-1.5 对决Nano Banana Pro测评丨302.AI 基准实验室
12月16日晚,OpenAI 正式发布了全新的旗舰图像生成模型——GPT Image 1.5 这确实是一个久违的名字。时间回溯到今年3月26日,OpenAI 首次推出了基于 GPT-4o 的图像生成模型 GPT Image 1.0,那场发布会直接引爆了一波席卷全球的”万物皆可吉卜力”风格热潮。无论是社交媒体上的普通用户,还是专业设计师…
年末开源图像模型决战:Z-Image-Turbo vs Flux.2 Dev 丨302.AI 基准实验室
在上篇《顶流开源模型Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测》我们对Flux.2的两个闭源版本(Pro和Flex)进行了测试。而在同一周(11月27日),阿里通义紧随Flux的步伐,也发布了全新的开源图像模型:Z-Image-Turbo. Z-Image-Turbo 是 Z-Image 的蒸馏版本,仅使用 8 次函数评估(NFE)…
昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室
11月25日,Black Forest Labs终于将其2024年发布的图像模型Flux迭代至2.0版本。作为开源模型,Flux曾凭借其性价比与微调能力,一时风头无两,几乎取代了Stable Diffusion的生态。诸如腾讯混元针对人像微调的Flux-1-SRPO也获得过我们不错的评价。但近半年,随着谷歌Nano Banana和字节跳动SeeDance的问…
美学大师 vs 世界模拟器:Seedream 4.5对决Nano Banana Pro,SOTA能否易主?丨302.AI 基准实验室
12月3日,火山引擎正式发布了新一代 AI 图像模型 Seedream 4.5,又进入到了熟悉的中国模型后发制人的节奏:今年 8 月末 Nano Banana 横空出世不久,字节跳动便带着 Seedream 4.0 进行精准狙击。在我们当时的横评文章中,Seedream 4.0 六战五胜,实现了对 Nano Banana 的全面反超。回顾一下对于 4.0 版…
AIGC万字指南(下):从A到Z,打破技术词汇认知壁垒 | 302.AI大白话聊一聊
话不多说,文接上篇,让我们从字母L继续。 字母L: LLM (Large Language Model,大语言模型) 定义:一个在海量文本数据上进行预训练,规模巨大、参数量通常在十亿级别以上的深度学习模型,能够理解和生成人类语言。 通俗解释:把它想象成一个读完了人类历史上几乎所有书籍、网页和对话的“超级大脑”或“通天晓”。它不仅能和你聊天,更能扮演“世界模拟…
AIGC Ten Thousand Words Guide (Part 1): From A to Z, Breaking the Barriers to Technical Vocabulary Cognition | 302. Have a chat in AI vernacular
By the end of 2025, AIGC (AI-Generated Content) has long evolved from a cutting-edge concept to a powerful productivity that has profoundly changed the creative industry. In essence, AIGC uses machine learning, especially deep learning models, to automatically generate new forms of digital assets such as text, images, audio, video, 3D interactive content, and even code through the learning of massive amounts of data. It is not only a technical tool, but also regarded as reshaping the logic of content production and driving the economy and society.…