Gemini
AI生图新王登基?即梦Seedream 4.0对决Nano Banana六轮实测全揭晓丨302.AI 基准实验室
在 Google 的图片编辑模型 Nano Banana 热度尚未消退之际,字节跳动 Seed 团队于昨日发布了其全新升级的生图模型 Seedream 4.0。该模型首次支持 4K 多模态生图,灵活支持文本、图像的组合输入,实现多图融合创作、参考生图、组合生图、图像编辑等核心功能。且其推理性能较 3.0 版本提升了近 10 倍,“画”之前会先“想”,能够深度…
翻车救星:谷歌官方Nano Banana提示词教程详解,附实测案例对比丨302.AI 实战教程
8月底,Gemini-2.5-flash-image(代号 Nano Banana)正式上线,持续数周的热度早已把全球网友的创作热情点燃。什么3D手办,跨界联名、赛博合影,纷纷依靠这个香蕉模型给一一实现,朋友圈和各大社区热闹非凡。 不过,热闹归热闹,仔细一看,还是能找到一些唱反调的声音。有用户吐槽诸如生成图崩掉了;提示词喂进去,产出的结果牛唇不对马嘴。而笔者…
302.AI 基准实验室丨国产大模型新卷王!GLM-4.5 开源登顶,逻辑推理硬刚 Grok 4?
北京时间 7 月 28 日,智谱发布了新一代旗舰模型 GLM-4.5 ,根据 Hugging Face 上的介绍,GLM -4.5 系列模型是专为 Agent 设计的基础模型。GLM-4.5 拥有 3550 亿个总参数,其中 320 亿个活跃参数;而 GLM-4.5-Air 则采用更紧凑的设计,拥有 1060 亿个总参数,其中 120 亿个活跃参数。GLM-…
Claude 4 系列最新对比测评,推理退步前端编程增强?| 302.AI 基准实验室
美东时间5月22日周四,Anthropic在公司首届”Code with Claude”开发者大会上推出了 Claude 4 系列的两款全新模型:Claude Opus 4和Claude Sonnet 4。 据了解,Claude Opus 4 和 Sonnet 4 都是混合推理模型,同时支持 Extended thinking(扩展推…
302.AI 基准实验室 | 大模型排行榜第二!Gemini-2.5-flash-preview-05-20全方位对比测评
北京时间 5 月 21 日,谷歌在 I/O 2025大会上带来了新模型:gemini-2.5-flash-preview-05-20。 gemini-2.5-flash-preview-05-20 是专为速度和低成本而设计,更新后的版本在推理、多模态、代码和长上下文等关键基准上都得到了改进,同时使用的 token 减少了 20-30%。 在lmarena.a…
Gemini-2.5-pro vs. Claude-3.7-Sonnet 前端编程能力实战对决| 302.AI 基准实验室
近日,谷歌提前推出了Gemini 2.5 Pro的最新版:Gemini 2.5 Pro Preview (I/O edition) 05-06 。官方介绍,这一版本模型的编码能力更强,用户只需一个提示即可构建更丰富的 Web 应用程序、游戏、模拟等 而最新版 Gemini 2.5 Pro Preview 05-06 也在 WebDev Arena 排行榜上超…
302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?
3月24日,DeepSeek V3 发布新版本:DeepSeek-V3-0324。 据官方介绍,新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在 HTML 等代码前端任务上,新版 V3 模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。 DeepSeek-V3.1(即DeepSe…
302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?
要说近期AI圈里最红的,应该就是来自谷歌的Gemini-2.0-flash-exp-image-generation。我们可以简单理解它为是一个图像编辑模型,gemini-2.0-flash-exp-image-generation可以结合了多模态输入、增强版推理以及自然语言理解来进行图像生成,还能够通过自然语言对话直接对图像进行修改。 这种把传统的语言大模…
302.AI 基准实验室 | ComfyUI API vs. Gemini-2.0-Flash图片编辑:突破玩具到商用的临界点
近期,302.AI上线了 ComfyUI 系列 API,这是基于 ComfyUI 实现的图片处理服务,可实现换装、换脸、换物、漫画图变真人、风格迁移等任务,生成的效果达到商用级,能够真正帮助电商企业制作出优质的产品宣传图。 同期,Google 的 Gemini 2.0 Flash 原生多模态能力在AI圈子掀起了一阵浪潮。据闻,这一功能可以通过文字描述处理文本…
302.AI 基准实验室 | o3-mini vs. Gemini 2.0 pro vs. DeepSeek-R1实测对比
自年前DeepSeek发布R1模型后便迅速引发了各界的广泛关注。 最近,各模型厂家都坐不住了,频频出招。 先是1月底,是OpenAI正式发布 o3-mini,这是OpenAI推理系列中最新、最具成本效益的模型。该模型支持低、中、高三档推理难度,并针对科学、数学、编程等领域进行了优化。 2月6日,谷歌也加入了 DeepSeek 、OpenAI 的战局,发布多个…