OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

8月12日,ChatGPT官方账号在社交媒体平台发文称ChatGPT推出了新的GPT-4o模型,但同时也明确,这次推出的GPT-4o模型是对GPT-4o的改进,而不是新的前沿模型。而且,ChatGPT官方表示这次的更新“难以明确说明”。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

然而,这一最新的模型ChatGPT-4o-latest在LMSYS的LLM竞技场排行榜中,已经以1314的综合分数超越曾经的第一名:谷歌的Gemini-1.5-Pro-Exp-0801。让OpenAI重回第一的宝座。ChatGPT-4o-latest在编码、指令遵循和复杂提示词的处理等多个方面都表现卓越。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

接下来,小编就带大家实践对比下GPT-4o和ChatGPT-4o-latest的使用效果,看下能不能找到具体的变化。

首先我们找到302.AI的模型竞技场,302.AI的模型竞技场更新模型的速度非常快,提供多种不同模型,用户无需单独访问各个模型的官网进行注册和登录付费,就能快速高效地对不同模型进行对比。此外,302.AI的模型竞技场不仅支持多轮对话,还支持上传图片、文本或代码文件进行分析。值得一提的是,302.AI的模型竞技场更新了社区功能,用户可以浏览精选提问,从中获得灵感和帮助。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

首先,我们进行了“草莓测试”。结果显示,GPT-4o的回答依然错误,而新版本的ChatGPT-4o-latest则回答正确,这与社交媒体平台上的用户说的不一样,新版本的ChatGPT-4o-latest成功通过了“草莓测试”:

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

接下来在社区的“弱智吧”类目中选择了一道问题提问:“我想配个6000多的电脑,大概要多少钱?”根据结果显示,两个模型都逃不过弱智吧的考验,回答内容基本一样,只是在语气上稍微有点不同:

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

继续提问,下面这道题主要测试是想要模型对于中文的理解能力,根据结果可以看到,对比两个模型的回答,ChatGPT-4o-latest模型对中文隐喻含义更精准的把握和理解,它不仅能够识别字面意义,更能深入挖掘语言背后的含义,从而提供更加贴切的回答:

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

最后,除了模型竞技场,302.AI聊天机器人API超市也同步更新了ChatGPT-4o-latest模型,对于只想单独使用ChatGPT-4o-latest模型的用户,可以选择302.AI的聊天机器人,值得一提的是,聊天机器人还支持一键分享给朋友使用。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

如果需要使用ChatGPT-4o-latest的API,则可以选择302.AI的API超市,支持在线调试,还提供详细的文档,方便用户快速接入模型功能。值得一提的是,302.AI提供按需付费的服务方式,无月费,无论是模型竞技场、聊天机器人、API超市,都可以更好地控制预算,节约成本。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

通过简单地对比测试,可以发现ChatGPT-4o-latest与GPT-4o之间的差别并不显著,这种细微的差别让官方在描述此次更新时也表示“难以明确说明”。然而,对于广大网友和AI技术爱好者来说,我们的目光已经超越了当前的更新,我们期待下一次,不是简单的迭代,而是AI领域中的一次重大飞跃。

参考文章:https://mp.weixin.qq.com/s/I_6ZARE9cy7JFhmLXoLlZA

(0)
302.AI302.AI
上一篇 2024 年 8 月 19 日 下午7:09
下一篇 2024 年 8 月 22 日 下午4:46

相关推荐

  • AI视力考验:各AI模型的视觉理解能力如何?

    近日,行业内有不少新模型涌现出大众的面前,我们会发现,有的模型会在其官方宣传中提到“多模态”一词,比如大家熟知的GPT-4o、Gemini 1.5 Pro等,在发布时都被定义为“原生多模态”,这些多模态LLM在相关的介绍中,都用到了“视觉能力”、“视觉理解”这样的表述。 简单的理解,就是这些模型能够“看得见,并看得懂”,仿佛人的眼睛。为此,很多人…

    2024 年 7 月 25 日
    7000
  • 可灵AI全面开放,引领视频创作新时代

    7月下旬,可灵AI(Kling AI)宣布全面开放,曾经在国内外内测名额“一号难求”的可灵成为了历史。可灵AI是由快手科技自研的视频生成大模型,能够根据文本提示生成长达2分钟、帧率为30fps的高质量视频,支持1080p分辨率,并支持多种宽高比,陆续升级推出了图生视频等功能。 从上线到全面开放,可灵历经了一个多月的时间: 6月10日,快手科技宣布推出了可灵大…

    2024 年 8 月 6 日
    6800
  • AI老照片修复功能,不止修复了画面也修复了记忆

    随着AI技术的发展,不断突破着传统界限。许多曾经存在想象中的事情变成了现实,这或许就是科技的意义。 最近看到了一个非常令人感动的文章“他用Luma和Suno复活了逝去11年的爱人,给我看破防了。” (参考原文:https://mp.weixin.qq.com/s/DIkPAA-P9P1AWveAFeNtqA) 原文是这样的,作者在X上看到了一个名为Koya …

    2024 年 7 月 17 日
    8000
  • Luma AI——引领AI行业进入高质量视频内容

    时隔不到一年,Luma AI又有新动作!!! Luma AI在当地时间6月12日官宣并发布新模型——Dream Machine。Dream Machine可以在120秒内生成120帧的视频,具备流畅的运动、电影摄影和戏剧效果。 去年11月,Luma AI在Discord服务器上推出了文生3D模型Genie,冲击了AI行业的一大突破口——3D生成。Luma A…

    2024 年 7 月 11 日
    9000
  • 提升AI协作效率,国内用户如何使用Artifacts功能?

    最近,由于汉语新解prompt的爆火,让Claude模型再次受到广泛关注。 提到Claude,或许大多数用户都会联想到Claude Artifacts,Anthropic在官网宣布推出Claude 3.5 Sonnet的同时,也宣布将在 Claude.ai上推出Artifacts功能,这一功能在用户请求Claude生成代码、文档或网站设计时,能够将这些生成的…

    21小时前
    900

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注