302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

3月24日,DeepSeek V3 发布新版本:DeepSeek-V3-0324

据官方介绍,新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在 HTML 等代码前端任务上,新版 V3 模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。

DeepSeek-V3.1(即DeepSeek-V3-0324)发布不到两天,谷歌也宣布推出全新模型:Gemini-2.5-ProGemini-2.5-Pro 是一个推理模型,在各种推理、数学、科学、编程基准上都表现出色。其中尤其擅长创建视觉效果好的Web应用、代码智能体应用、代码转换和编辑。

话不多说,今天302.AI团队就通过五个案例实测对比 DeepSeek-V3.1、Gemini-2.5-Pro、Claude-3.7-sonnet在前端任务上的表现,看看到底谁更胜一筹!


DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7模型实测

实测使用的工具为:302.AI聊天机器人-Artifacts功能

实测1:公众号封面

提示词:

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

优劣排名:DeepSeek-V3.1>Claude-3.7-sonnet>Gemini-2.5-Pro

DeepSeek-V3.1:色彩搭配协调,构图排版合理,还自动提炼出了关键话题在封面最下方,整体效果很不错

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

Gemini-2.5-Pro:排版构图很乱,整体效果较差

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

Claude-3.7-sonnet:画面色彩、构图合理,但视觉上展示的元素较少,稍显单调

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

实测2:赛博朋克贪吃蛇游戏

提示词:帮我制作一个赛博朋克贪吃蛇游戏,在单个HTML中运行。

优劣排名:Gemini-2.5-Pro>DeepSeek-V3.1>Claude-3.7-sonnet

DeepSeek-V3.1:风格符合提示词要求,游戏可交互、运行起来没有问题,但是可改进的空间较大,比如缺乏开始游戏按钮、没有游戏说明等。

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

Gemini-2.5-Pro:综合效果最好,风格符合,可操作且具备了游戏说明,整体较为完整

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

Claude-3.7-sonnet:虽然风格符合,但实操发现游戏无法运行

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

实测3:模拟太阳系行星运动

提示词:模拟一个太阳系行星运动,在单个HTML中运行

优劣排名:DeepSeek-V3.1>Gemini-2.5-Pro>Claude-3.7-sonnet

DeepSeek-V3.1:具备了速度滑动条,可暂停和重置,点击星星可展示介绍,效果较好

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

Gemini-2.5-Pro:效果没有太多的问题,但是对比其他模型较为单调

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

Claude-3.7-sonnet:页面元素较丰富,但可惜只展示了四颗行星,效果不完整,不知模型是存在常识错误还是故意简化展示。

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

实测4:网页设计

提示词:AI 公司「302.AI」创建一个外观精美的响应式首页,将所有内容包含在一个 HTML5 文件中。

优劣排名:DeepSeek-V3.1>Claude-3.7-sonnet>Gemini-2.5-Pro

DeepSeek-V3.1:内容匹配度很高,色彩协调且美观,给人一种干净利落的视觉感受,效果很惊艳

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

Gemini-2.5-Pro:色彩搭配还算协调,但页面文字过多视觉上较为繁杂。

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

Claude-3.7-sonnet:布局较协调、内容丰富,视觉上整体比Gemini好一点,但不及DeepSeek。

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

实测5:手机APP原型设计

提示词:

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

优劣排名:DeepSeek-V3.1>Gemini-2.5-Pro>Claude-3.7-sonnet

DeepSeek-V3.1:真实感较强的原型设计图,与其他两个模型效果对比,交互性更强,不过在购物车页面稍有瑕疵

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

Gemini-2.5-Pro:页面内容很丰富,采用平铺式展示交互性相对不够

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

Claude-3.7-sonnet:丰富度上不及另两个模型,仅有一个页面,且没有交互跳转。

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

实测总结:

综合以上是实测,可初步得出以下效果:

(1)总体而言,综合能力较强的是DeepSeek-V3.1,无论是公众号封面生成、还是网页设计任务,都能够提供更高质量的输出。

(2)Gemini-2.5-Pro视觉设计和内容丰富度方面显得略为单薄,例如在赛博朋克贪吃蛇游戏和模拟太阳系行星运动中丰富度不及另两个模型。

(3)Claude-3.7-sonnet则在某些特定任务中表现突出,如公众号封面生成、网页设计等,但在前端任务上仍未能与 DeepSeek-V3.1 相媲美。


在302.AI上使用DeepSeek-V3-0324和Gemini-2.5-Pro模型

302.AI的聊天机器人和API超市提供了按需付费无订阅的服务方式企业和个人用户可按需灵活选用。

1、使用模型对话

依次点击使用机器人→聊天机器人→ 找到国产模型/Gemini分类 → 选择模型→创建聊天机器人;

DeepSeek-V3-0324:

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

Gemini-2.5-Pro:

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?

2、使用模型API

企业用户可以通过302.AI的API超市快速、便捷地调用模型,还能够根据特定项目需求进行定制化开发

相关文档:使用API→API超市→语言大模型→国产模型/Gemini→查看文档;

302.AI 基准实验室 | DeepSeek-V3.1 vs. Gemini-2.5 vs. Claude-3.7,到底谁在前端任务上更胜一筹?


👉立即注册免费试用302.AI,开启你的AI之旅!👈

为什么选择302.AI?

● 灵活付费:无需月费,按需付费,成本可控
● 丰富功能:从文字、图片到视频,应有尽有,满足多种场景需求
● 开源生态:支持开发者深度定制,打造专属AI应用
● 易用性:界面友好,操作简单,快速上手

302.AI 新品发布 | 图像创意站:GPT-Image-1玩法全解析,轻松生成惊艳作品
All Rights Reserved by 302.AI
Like (1)
302.AI302.AI
Previous 2025 年 3 月 26 日 上午11:24
Next 2025 年 3 月 29 日 上午11:04

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注