OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

8月12日,ChatGPT官方账号在社交媒体平台发文称ChatGPT推出了新的GPT-4o模型,但同时也明确,这次推出的GPT-4o模型是对GPT-4o的改进,而不是新的前沿模型。而且,ChatGPT官方表示这次的更新“难以明确说明”。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

然而,这一最新的模型ChatGPT-4o-latest在LMSYS的LLM竞技场排行榜中,已经以1314的综合分数超越曾经的第一名:谷歌的Gemini-1.5-Pro-Exp-0801。让OpenAI重回第一的宝座。ChatGPT-4o-latest在编码、指令遵循和复杂提示词的处理等多个方面都表现卓越。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

接下来,小编就带大家实践对比下GPT-4o和ChatGPT-4o-latest的使用效果,看下能不能找到具体的变化。

首先我们找到302.AI的模型竞技场,302.AI的模型竞技场更新模型的速度非常快,提供多种不同模型,用户无需单独访问各个模型的官网进行注册和登录付费,就能快速高效地对不同模型进行对比。此外,302.AI的模型竞技场不仅支持多轮对话,还支持上传图片、文本或代码文件进行分析。值得一提的是,302.AI的模型竞技场更新了社区功能,用户可以浏览精选提问,从中获得灵感和帮助。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

首先,我们进行了“草莓测试”。结果显示,GPT-4o的回答依然错误,而新版本的ChatGPT-4o-latest则回答正确,这与社交媒体平台上的用户说的不一样,新版本的ChatGPT-4o-latest成功通过了“草莓测试”:

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

接下来在社区的“弱智吧”类目中选择了一道问题提问:“我想配个6000多的电脑,大概要多少钱?”根据结果显示,两个模型都逃不过弱智吧的考验,回答内容基本一样,只是在语气上稍微有点不同:

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

继续提问,下面这道题主要测试是想要模型对于中文的理解能力,根据结果可以看到,对比两个模型的回答,ChatGPT-4o-latest模型对中文隐喻含义更精准的把握和理解,它不仅能够识别字面意义,更能深入挖掘语言背后的含义,从而提供更加贴切的回答:

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

最后,除了模型竞技场,302.AI聊天机器人API超市也同步更新了ChatGPT-4o-latest模型,对于只想单独使用ChatGPT-4o-latest模型的用户,可以选择302.AI的聊天机器人,值得一提的是,聊天机器人还支持一键分享给朋友使用。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

如果需要使用ChatGPT-4o-latest的API,则可以选择302.AI的API超市,支持在线调试,还提供详细的文档,方便用户快速接入模型功能。值得一提的是,302.AI提供按需付费的服务方式,无月费,无论是模型竞技场、聊天机器人、API超市,都可以更好地控制预算,节约成本。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

通过简单地对比测试,可以发现ChatGPT-4o-latest与GPT-4o之间的差别并不显著,这种细微的差别让官方在描述此次更新时也表示“难以明确说明”。然而,对于广大网友和AI技术爱好者来说,我们的目光已经超越了当前的更新,我们期待下一次,不是简单的迭代,而是AI领域中的一次重大飞跃。

参考文章:https://mp.weixin.qq.com/s/I_6ZARE9cy7JFhmLXoLlZA

All Rights Reserved by 302.AI
Like (0)
302.AI302.AI
Previous 2024 年 8 月 19 日 下午7:09
Next 2024 年 8 月 22 日 下午4:46

相关推荐

  • 资讯丨FLUX 1.1 Pro推出Ultra模式,来302.AI实测揭秘真实效果

    11月6日,BlackForestLabs宣布推出FLUX1.1 pro的Ultra模式,添加了新的高分辨率功能,还增加了一个RAW参数,这一参数提升了生成图片的拟真度,让生成的图片摆脱了“AI味”,为用户带来了新的视觉体验。 据官网介绍,FLUX 1.1 Pro Ultra支持高达4兆像素(4MP)的图像生成,这是标准模式的四倍。这一提升使得生成的图像更加…

    2024 年 11 月 11 日 AI资讯
    6050
  • 资讯丨xAI官宣Grok API开启公测,唯一模型grok-beta表现能否达到预期?

    11月6日,备受瞩目的2024年美国总统选举结果终于揭晓,马斯克公开支持的美国共和党总统候选人特朗普获得最终胜利。 作为特朗普的“榜一大哥”马斯克,是人工智能初创公司xAI的始人之一和主要投资者。在11月4日,xAI刚刚官宣Grok API正式开启公测。 根据xAI公司官方发布的文档,可以看到xAI的API目前只有一个模型——“grok-beta”。 从官方…

    2024 年 11 月 8 日 AI资讯
    3150
  • 资讯丨302.AI已支持Anthropic最新模型Claude 3.5 Haiku,与其他模型对比表现如何?

    11月5日,Anthropic在社交媒体平台宣布Claude 3.5 Haiku可以通过API访问。Claude 3.5 Haiku是Anthropic公司在10月22日发布的新模型,在许多评估中的性能与 Claude 3 Opus不相上下,而成本和速度却与上一代Haiku相当。 根据官方介绍,Claude 3.5 Haiku 在各种编码、工具使用和推理任务…

    2024 年 11 月 6 日 AI资讯
    4250
  • Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

    10月22日,Stability AI推出最新图像生成模型Stable Diffusion 3.5,其中包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo两个版本,并宣布预计在10月29日上线Medium版本。 10月29日,Stable Diffusion 3.5 Medium如期推出…

    2024 年 11 月 5 日 AI资讯
    1.1K0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注