模型测评
302.AI 基准实验室丨全面刷新榜单,“全球最强AI”Grok 4评测:真实实力与局限解析
2025年7月10日,全球AI领域再次迎来一场震撼级的技术革新。埃隆·马斯克旗下的xAI公司,在这一天正式向世界揭开了其最新一代大型语言模型——Grok 4的神秘面纱。xAI大胆宣称Grok 4是“全球最强大AI”,并用一系列令人咋舌的基准测试成绩,强有力地支撑了这一论断。 Grok 4不仅推出了强大的单智能体版本,更带来了突破性的多智能体协作版本Grok …
302.AI 基准实验室丨从街头到秀场:拟真度新皇登基!文生图模型Higgsfield Soul 开箱测评
北京时间6月26日凌晨,Higgsfield AI 在海外社交媒体平台 X 宣布推出文生图模型 Higgsfield Soul,官方介绍这是一款高端美学照片模型(High Aesthetic Photo Model)。一上线即凭「一键高定时装」与「实时姿态驱动」两大黑科技刷爆社媒。Soul 结合跨模态纹理映射与可控人体骨骼动画,可在数秒内把任何草图或文字 p…
2025上半年AI生图王者之争:302.AI集结全明星阵容,TOP5模型实测揭晓!AIGC爱好者必读
I. 前言:2025上半年AI生图模型评测 – 迈向拟真与高效的新纪元 在过去两年里,无论你刷社交媒体、看电视节目,还是注意到街头巷尾的广告,AI生成的图像早已全方位融入到我们的生活中。2025年上半年,AI图像生成领域再次迎来爆发式增长,技术突破与应用落地呈现出前所未有的加速态势。从ChatGPT、Sora等模型的突破性进展,到国产大模型的飞速…
302.AI 基准实验室丨三大最新语言模型:Gemini/Doubao/Minimax 高考数学与游戏编程实战测评
6月,各大模型厂商如同上了“发条”,新品发布纷至沓来。 6月11日,Force 2025 原动力大会上,火山引擎正式发布豆包大模型 1.6 版(Doubao-Seed-1.6)。该系列中包含了三个主要版本:标准版 Doubao-Seed-1.6、深度思考强化版 Doubao-Seed-1.6-thinking 以及极速版 Doubao-Seed-1.6-fl…
302.AI 基准实验室丨2025上半年终极视频模型争霸!Seedance 1.0 vs Kling 2.1 vs Veo 3 实测
北京时间6月11日,火山引擎在召开的 Force 2025 原动力大会上,正式发布了豆包大模型 1.6 版(Doubao-Seed-1.6)、豆包·视频生成模型 Seedance 1.0 pro、豆包·语音播客模型以及豆包·实时语音模型。 其中,全新发布的豆包·视频生成模型 Seedance 1.0 pro 支持文字与图片输入,可生成多镜头无缝切换的1080…
302.AI 基准实验室丨新版 DeepSeek-R1-0528 对比旧版区别在哪?速看对比实测结果
北京时间 5 月 28 日晚,DeepSeek 在官方社群推送了更新通知。 5 月 29 日 DeepSeek 正式在社媒平台宣布 DeepSeek R1 模型已完成小版本升级,当前版本更新为 DeepSeek-R1-0528。 Hugging Face模型榜登顶 根据 DeepSeek 官方重点信息提炼: 更新后的 R1 模型在数学、编程与通用逻辑等多个基…
302.AI 基准实验室丨Claude 4 系列最新对比测评,推理退步前端编程增强?
美东时间5月22日周四,Anthropic在公司首届”Code with Claude”开发者大会上推出了 Claude 4 系列的两款全新模型:Claude Opus 4和Claude Sonnet 4。 据了解,Claude Opus 4 和 Sonnet 4 都是混合推理模型,同时支持 Extended thinking(扩展推…
302.AI 基准实验室 | 大模型排行榜第二!Gemini-2.5-flash-preview-05-20全方位对比测评
北京时间 5 月 21 日,谷歌在 I/O 2025大会上带来了新模型:gemini-2.5-flash-preview-05-20。 gemini-2.5-flash-preview-05-20 是专为速度和低成本而设计,更新后的版本在推理、多模态、代码和长上下文等关键基准上都得到了改进,同时使用的 token 减少了 20-30%。 在lmarena.a…
302.AI 基准实验室 | Gemini-2.5-pro vs. Claude-3.7-Sonnet 前端编程能力实战对决
近日,谷歌提前推出了Gemini 2.5 Pro的最新版:Gemini 2.5 Pro Preview (I/O edition) 05-06 。官方介绍,这一版本模型的编码能力更强,用户只需一个提示即可构建更丰富的 Web 应用程序、游戏、模拟等 而最新版 Gemini 2.5 Pro Preview 05-06 也在 WebDev Arena 排行榜上超…