8月12日,ChatGPT官方账号在社交媒体平台发文称ChatGPT推出了新的GPT-4o模型,但同时也明确,这次推出的GPT-4o模型是对GPT-4o的改进,而不是新的前沿模型。而且,ChatGPT官方表示这次的更新“难以明确说明”。
然而,这一最新的模型ChatGPT-4o-latest在LMSYS的LLM竞技场排行榜中,已经以1314的综合分数超越曾经的第一名:谷歌的Gemini-1.5-Pro-Exp-0801。让OpenAI重回第一的宝座。ChatGPT-4o-latest在编码、指令遵循和复杂提示词的处理等多个方面都表现卓越。
接下来,小编就带大家实践对比下GPT-4o和ChatGPT-4o-latest的使用效果,看下能不能找到具体的变化。
首先我们找到302.AI的模型竞技场,302.AI的模型竞技场更新模型的速度非常快,提供多种不同模型,用户无需单独访问各个模型的官网进行注册和登录付费,就能快速高效地对不同模型进行对比。此外,302.AI的模型竞技场不仅支持多轮对话,还支持上传图片、文本或代码文件进行分析。值得一提的是,302.AI的模型竞技场更新了社区功能,用户可以浏览精选提问,从中获得灵感和帮助。
首先,我们进行了“草莓测试”。结果显示,GPT-4o的回答依然错误,而新版本的ChatGPT-4o-latest则回答正确,这与社交媒体平台上的用户说的不一样,新版本的ChatGPT-4o-latest成功通过了“草莓测试”:
接下来在社区的“弱智吧”类目中选择了一道问题提问:“我想配个6000多的电脑,大概要多少钱?”,根据结果显示,两个模型都逃不过弱智吧的考验,回答内容基本一样,只是在语气上稍微有点不同:
继续提问,下面这道题主要测试是想要模型对于中文的理解能力,根据结果可以看到,对比两个模型的回答,ChatGPT-4o-latest模型对中文隐喻含义更精准的把握和理解,它不仅能够识别字面意义,更能深入挖掘语言背后的含义,从而提供更加贴切的回答:
最后,除了模型竞技场,302.AI的聊天机器人和API超市也同步更新了ChatGPT-4o-latest模型,对于只想单独使用ChatGPT-4o-latest模型的用户,可以选择302.AI的聊天机器人,值得一提的是,聊天机器人还支持一键分享给朋友使用。
如果需要使用ChatGPT-4o-latest的API,则可以选择302.AI的API超市,支持在线调试,还提供详细的文档,方便用户快速接入模型功能。值得一提的是,302.AI提供按需付费的服务方式,无月费,无论是模型竞技场、聊天机器人、API超市,都可以更好地控制预算,节约成本。
通过简单地对比测试,可以发现ChatGPT-4o-latest与GPT-4o之间的差别并不显著,这种细微的差别让官方在描述此次更新时也表示“难以明确说明”。然而,对于广大网友和AI技术爱好者来说,我们的目光已经超越了当前的更新,我们期待下一次,不是简单的迭代,而是AI领域中的一次重大飞跃。
参考文章:https://mp.weixin.qq.com/s/I_6ZARE9cy7JFhmLXoLlZA