OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

8月12日,ChatGPT官方账号在社交媒体平台发文称ChatGPT推出了新的GPT-4o模型,但同时也明确,这次推出的GPT-4o模型是对GPT-4o的改进,而不是新的前沿模型。而且,ChatGPT官方表示这次的更新“难以明确说明”。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

然而,这一最新的模型ChatGPT-4o-latest在LMSYS的LLM竞技场排行榜中,已经以1314的综合分数超越曾经的第一名:谷歌的Gemini-1.5-Pro-Exp-0801。让OpenAI重回第一的宝座。ChatGPT-4o-latest在编码、指令遵循和复杂提示词的处理等多个方面都表现卓越。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

接下来,小编就带大家实践对比下GPT-4o和ChatGPT-4o-latest的使用效果,看下能不能找到具体的变化。

首先我们找到302.AI的模型竞技场,302.AI的模型竞技场更新模型的速度非常快,提供多种不同模型,用户无需单独访问各个模型的官网进行注册和登录付费,就能快速高效地对不同模型进行对比。此外,302.AI的模型竞技场不仅支持多轮对话,还支持上传图片、文本或代码文件进行分析。值得一提的是,302.AI的模型竞技场更新了社区功能,用户可以浏览精选提问,从中获得灵感和帮助。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

首先,我们进行了“草莓测试”。结果显示,GPT-4o的回答依然错误,而新版本的ChatGPT-4o-latest则回答正确,这与社交媒体平台上的用户说的不一样,新版本的ChatGPT-4o-latest成功通过了“草莓测试”:

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

接下来在社区的“弱智吧”类目中选择了一道问题提问:“我想配个6000多的电脑,大概要多少钱?”根据结果显示,两个模型都逃不过弱智吧的考验,回答内容基本一样,只是在语气上稍微有点不同:

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

继续提问,下面这道题主要测试是想要模型对于中文的理解能力,根据结果可以看到,对比两个模型的回答,ChatGPT-4o-latest模型对中文隐喻含义更精准的把握和理解,它不仅能够识别字面意义,更能深入挖掘语言背后的含义,从而提供更加贴切的回答:

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

最后,除了模型竞技场,302.AI聊天机器人API超市也同步更新了ChatGPT-4o-latest模型,对于只想单独使用ChatGPT-4o-latest模型的用户,可以选择302.AI的聊天机器人,值得一提的是,聊天机器人还支持一键分享给朋友使用。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

如果需要使用ChatGPT-4o-latest的API,则可以选择302.AI的API超市,支持在线调试,还提供详细的文档,方便用户快速接入模型功能。值得一提的是,302.AI提供按需付费的服务方式,无月费,无论是模型竞技场、聊天机器人、API超市,都可以更好地控制预算,节约成本。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

通过简单地对比测试,可以发现ChatGPT-4o-latest与GPT-4o之间的差别并不显著,这种细微的差别让官方在描述此次更新时也表示“难以明确说明”。然而,对于广大网友和AI技术爱好者来说,我们的目光已经超越了当前的更新,我们期待下一次,不是简单的迭代,而是AI领域中的一次重大飞跃。

参考文章:https://mp.weixin.qq.com/s/I_6ZARE9cy7JFhmLXoLlZA

All Rights Reserved by 302.AI
Like (0)
302.AI302.AI
Previous 2024 年 8 月 19 日 下午7:09
Next 2024 年 8 月 22 日 下午4:46

相关推荐

  • 302.AI 新品发布 | AI绘图总翻车?绘图提示词专家帮你精准复刻图片,自由修改风格!

    许多人在使用AI绘图时,都会面临一些棘手的问题,比如想复刻某张图,但尝试了不同的关键词后生成效果依然货不对板;再比如想要对现有的图片进行风格调整使其更贴合自己的独特需求,但却难以维持画面元素的一致性。 针对以上痛点,302.AI 上新了一款AI绘图提示词专家工具,这一工具结合了“图片转提示词”和“风格修改”两大功能,用户不仅可以通过上传图片获得精准提示词复刻…

    2025 年 4 月 25 日 AI资讯
    1340
  • 资讯丨马斯克号称地表最强的Grok 3系列模型,在实测中到底能否超越R1和o3-mini?

    2月19日,马斯克旗下的大模型平台 xAI 推出了新的模型——Grok-3。官方宣称,Grok-3 在推理、数学、编码和指令遵循任务中均表现出色,并在一系列基准测试中表现出色。而马斯克更是称一模型为 ⌈ 地表最强 ⌋。 (非推理模式的Grok-3与其它大模型能力对比) 根据了解,grok-3 并非单一模型,而是一个包含多个版本的模型家族。其中包括了变体版本—…

    2025 年 2 月 24 日 AI资讯
    3040
  • 资讯丨通义万相2.1模型实测绝了!汉字竟在视频里“活”了

    继豆包图像模型攻克汉字生成的难题后,国内AI视频生成领域在中文生成方面再次来了新突破! 今年年初,阿里云推出了全新升级的的视频生成模型——通义万相2.1。据了解,这是⌈ 首个具备中文文字生成能力的视频生成模型 ⌋ 。 通义万相2.1视频模型一经推出,便以 84.70% 总分登顶权威评测榜单VBench榜首。除了中文文字生成的创新,该模型在复杂运动、大幅度动作…

    2025 年 2 月 21 日 AI资讯
    7680
  • 资讯丨302.AI 代码竞技场:大模型编程能力的“超级擂台”

    一个大模型能力强不强,我们常常会从多个维度去评估,其中编程能力是尤为关键的一项。 对于许多用户而言,想要准确测试大模型的代码能力却常常不知道该从何入手,或者不知道选择哪个平台进行测试。 为了帮助用户解决这一问题,302.AI最新上线了一款工具——代码竞技场,这一工具集结了多种先进模型,为用户提供了一个广阔、便捷、易用的代码测试平台。 工具界面展示: 302.…

    2025 年 2 月 19 日 AI资讯
    2730

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注