OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

8月12日,ChatGPT官方账号在社交媒体平台发文称ChatGPT推出了新的GPT-4o模型,但同时也明确,这次推出的GPT-4o模型是对GPT-4o的改进,而不是新的前沿模型。而且,ChatGPT官方表示这次的更新“难以明确说明”。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

然而,这一最新的模型ChatGPT-4o-latest在LMSYS的LLM竞技场排行榜中,已经以1314的综合分数超越曾经的第一名:谷歌的Gemini-1.5-Pro-Exp-0801。让OpenAI重回第一的宝座。ChatGPT-4o-latest在编码、指令遵循和复杂提示词的处理等多个方面都表现卓越。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

接下来,小编就带大家实践对比下GPT-4o和ChatGPT-4o-latest的使用效果,看下能不能找到具体的变化。

首先我们找到302.AI的模型竞技场,302.AI的模型竞技场更新模型的速度非常快,提供多种不同模型,用户无需单独访问各个模型的官网进行注册和登录付费,就能快速高效地对不同模型进行对比。此外,302.AI的模型竞技场不仅支持多轮对话,还支持上传图片、文本或代码文件进行分析。值得一提的是,302.AI的模型竞技场更新了社区功能,用户可以浏览精选提问,从中获得灵感和帮助。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

首先,我们进行了“草莓测试”。结果显示,GPT-4o的回答依然错误,而新版本的ChatGPT-4o-latest则回答正确,这与社交媒体平台上的用户说的不一样,新版本的ChatGPT-4o-latest成功通过了“草莓测试”:

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

接下来在社区的“弱智吧”类目中选择了一道问题提问:“我想配个6000多的电脑,大概要多少钱?”根据结果显示,两个模型都逃不过弱智吧的考验,回答内容基本一样,只是在语气上稍微有点不同:

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

继续提问,下面这道题主要测试是想要模型对于中文的理解能力,根据结果可以看到,对比两个模型的回答,ChatGPT-4o-latest模型对中文隐喻含义更精准的把握和理解,它不仅能够识别字面意义,更能深入挖掘语言背后的含义,从而提供更加贴切的回答:

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

最后,除了模型竞技场,302.AI聊天机器人API超市也同步更新了ChatGPT-4o-latest模型,对于只想单独使用ChatGPT-4o-latest模型的用户,可以选择302.AI的聊天机器人,值得一提的是,聊天机器人还支持一键分享给朋友使用。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

如果需要使用ChatGPT-4o-latest的API,则可以选择302.AI的API超市,支持在线调试,还提供详细的文档,方便用户快速接入模型功能。值得一提的是,302.AI提供按需付费的服务方式,无月费,无论是模型竞技场、聊天机器人、API超市,都可以更好地控制预算,节约成本。

OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

通过简单地对比测试,可以发现ChatGPT-4o-latest与GPT-4o之间的差别并不显著,这种细微的差别让官方在描述此次更新时也表示“难以明确说明”。然而,对于广大网友和AI技术爱好者来说,我们的目光已经超越了当前的更新,我们期待下一次,不是简单的迭代,而是AI领域中的一次重大飞跃。

参考文章:https://mp.weixin.qq.com/s/I_6ZARE9cy7JFhmLXoLlZA

(0)
302.AI302.AI
上一篇 2024 年 8 月 19 日 下午7:09
下一篇 2024 年 8 月 22 日 下午4:46

相关推荐

  • Coze正式开启付费计划!GPT-4白嫖时代结束?

    7月刚刚到来,Coze海外版就静悄悄开启付费计划,推出了Coze Premium Pricing Plans,得知这一消息的众多AI爱好者纷纷表示白嫖GPT-4的时代要结束了。 Coze是由字节跳动推出的AI聊天机器人构建平台,它允许用户快速创建、调试和优化AI聊天机器人的应用程序。这个平台特别适合对AI和机器人技术感兴趣的人,尤其是那些缺乏编程经验的用户。…

    2024 年 7 月 12 日
    17800
  • 阿里千问发布数学模型Qwen2-Math,最好的数学模型出现了?!

    8月9日,阿里通义团队发布新一代数学模型Qwen2-Math,据官方称,Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型,其数学能力显著超越了开源模型,甚至超过了闭源模型(如 GPT-4o),Qwen2-Math包含1.5B、7B、72B三个参数的基础模型和指令微调模型。 在一系列数学基准评测上,Qwen2-Math-…

    2024 年 8 月 19 日
    7800
  • Runway官宣上线Gen-3 Alpha!无门槛抢先体验

    7月2日凌晨,Runway在社交媒体正式宣布,Gen-3 Alpha全面开放使用! Runway是一家专注于AI视频生成的公司,其推出的Gen系列模型在视频创作领域引起了广泛关注。 据说最新推出的Gen-3 Alpha模型在保真度、一致性和动作表现方面都有重大改进! 都说Gen-3 Alpha很强,那我们先看下来自官网的一段视频: (Prompt:在日本城市…

    2024 年 7 月 12 日
    5400
  • 百度发布的升级版Ernie4.0 Turbo模型将与GPT-4竞争?

    6月28日百度WAVE SUMMIT峰会上发布了最新的文心大模型 4.0 Turbo即Ernie 4.0 turbo。 Ernie 4.0 turbo 是2023年10月推出的 Ernie 4.0 模型的升级版,这一新版本在反应速度和性能上有了显著提升。 Ernie 4.0 Turbo的全称为“Enhanced Representation through …

    2024 年 7 月 22 日
    12800
  • 中国专利数量远超其他国家,用户如何实现高效的专利搜索?

    7月初,世界知识产权组织(WIPO)发布了一份引人注目的报告。该报告揭示了:中国发明人申请的生成式人工智能专利数量不仅位居全球榜首,而且大幅领先于其他国家。 世界知识产权组织(WIPO)最新发布的《WIPO Patent Landscape Report on Generative AI》显示:在2014年至2023年的这一段将近10年的时间里,中国的生成式…

    2024 年 8 月 1 日
    5500

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注