模型竞技场:中秋国庆调休来了,哪个AI能算明白?

不知不觉中,2024年的时光已悄然流逝了三分之二。

许多打工人和学生党即将迎来中秋和国庆两个假期。放假是件开心的事情,然而,有网友发现,今年的中秋国庆假期放假和调休时间安排颇为复杂,这一话题因此登上了社交平台热搜榜,引发了广泛关注,阅读量激增至4亿,讨论量也高达11.3万。

模型竞技场:中秋国庆调休来了,哪个AI能算明白?

对于接下来从九月第二周开始到十月“上6休3上3休2上5休1上2休7再上5休1”的放假上班时间,谁能不迷糊?

网友纷纷辣评:“这是写了一串代码吗?”,“比我的心还乱”,”这是不是紧箍咒,念得我头好疼

模型竞技场:中秋国庆调休来了,哪个AI能算明白?

评论区还有网友提出疑问:“就意思中秋比平时无节日月份多一天假。然后国庆比平时无节日月份多两天对吧?”

所以,“除了本来就该放的周末,我们在中秋和国庆这两个假期中实际上是多放了几天假呢?”

对于这个问题,有人说是三天、有人说是四天、也有人说是五天,既然出现了这么多不同的答案,不如借着这个机会考考AI们?前段时间在《歌手》节目引发的“13.8和13.11哪个大”的问题难倒了不少的AI,这次AI们的表现又会怎么样呢?

首先整理下提问的问题:

这是中国 2024 年 9 月 9 日(星期一)开始到 10 月 13 日的放假调休安排:上6 休 3 上 3 休 2 上 5 休 1 上 2 休 7 再上 5 休 1。那么请问除了本来该休的周末,我因为放假多休息了几天?

为了节省时间,避免繁琐的逐一注册和登录流程,以及能够更直观、更便捷地对比不同AI模型的答案,小编使用302.AI的模型竞技场对这次的问题进行测试,302.AI提供按需付费的使用方式,还可以在高级设置里开启是否在机器人端显示消耗,使用模型竞技场不仅省去逐个模型注册登录的繁琐流程,还能够节省更多的成本,更好控制预算。

模型竞技场:中秋国庆调休来了,哪个AI能算明白?

302.AI的模型竞技场提供了国内外多种AI模型,分类明晰且模型更新速度非常快。用户只需勾选所需要的模型发送内容即可,此外,302.AI的模型竞技场还支持多轮对话及社区功能,提供给用户更多提问灵感。

模型竞技场:中秋国庆调休来了,哪个AI能算明白?

小编勾选了GPT-4o、Claude-3.5-Sonnet、Qwen-Max、Step-2-16k、豆包、文心一言4.0 turbo六种模型,为了公平,每个模型仅提问一次。接下来,就来看下AI模型们的表现:

令人意外的是,开局【GPT-4o】直接来了个大,一顿操作计算解释,最后直接告诉我多放了14天的假(小编心里os:苍天啊,国庆+中秋一共加起来也才10天啊),仔细推敲GPT-4o的计算过程可以发现,GPT-4o莫名其妙先加上9月9日之前的周末,并且将正常周末休息时间加上了调休的休息时间当作总的休息日,实际上,这两部分时间会有重叠不能直接计算的:

模型竞技场:中秋国庆调休来了,哪个AI能算明白?

看完GPT-4o,再来看下【Claude-3.5-Sonnet】,虽然分析过程非常简洁,仅有4个步骤,但是逻辑在线一目了然,回答正确:

模型竞技场:中秋国庆调休来了,哪个AI能算明白?

接下来是【Qwen-Max】,明明在提问中已经提到9月9日是星期一,但是Qwen-Max直接假设错误9月1日为周六,而且,Qwen-Max从9月1日开始计算,与GPT-4o出现的问题大致相同,将正常的周末休息时间与调休放假时间区分为两个独立的时间,实际这两个时间里是有重叠的:

模型竞技场:中秋国庆调休来了,哪个AI能算明白?

而【Step-2-16k对比Qwen-Max和GPT-4o分析过程相对聪明一点,但是由于把9月9日之前的周末休息时间也算进去,导致答案出现了错误。简单地说就是:“理解了但又没完全理解”:

模型竞技场:中秋国庆调休来了,哪个AI能算明白?

看看【豆包】模型的答案,别看它只有短短几行,它还回答错误了呢!仔细看下解释过程,9月9日到10月13日这期间,周末的天数为5周,总天数是10天,不知道为什么突然冒出来了4周多5天的时间:

模型竞技场:中秋国庆调休来了,哪个AI能算明白?

最后是【文心一言4.0 turbo】,看了半天,实在是没看明白整个逻辑,9月9日为星期一的话,上6休3中额外休息一天是没错,但是紧接着上3休2,休息的2天推算可以得出是为正常的周末,正常的周末并不是额外的休息,从这一步开始就出错了,以致后面答案都是错的:

模型竞技场:中秋国庆调休来了,哪个AI能算明白?

在本次测试的六个模型中,最终只有Claude-3.5-Sonne是回答正确的!

实在没想到,原本是打算让AI帮忙算算明白,但从上面的结果来看,这是把AI越绕越晕了。

既然AI算不明白,还是我们自己算吧,先来看下九月、十月的放假日历。

首先,我们将调休要上班的周末和工作日放假的时间对消,如黑色直线;

接下来再去除原本周末的时间,如黄色直线;

那最后剩下的就是我们多休息时间了,总共是4天

模型竞技场:中秋国庆调休来了,哪个AI能算明白?

虽然在一顿计算后发现经过调休中秋+国庆其实只多放了4天的假期,但是小编还是认为有比没有好,不管是多放几天假,能够有休息时间总是好的。在这个快节奏的时代,人们普遍感受到了工作和学习带来的压力,而节假日正是一个让大家可以暂时放松、陪伴家人和朋友的机会,最后希望大家能够享受假期时光,快乐每一天!

参考文章:https://mp.weixin.qq.com/s/vR0qghu5iYaWkStD1GV-SQ

Like (0)
302.AI302.AI
Previous 2024 年 8 月 28 日 下午6:24
Next 2024 年 9 月 2 日 下午4:13

相关推荐

  • AI视力考验:各AI模型的视觉理解能力如何?

    近日,行业内有不少新模型涌现出大众的面前,我们会发现,有的模型会在其官方宣传中提到“多模态”一词,比如大家熟知的GPT-4o、Gemini 1.5 Pro等,在发布时都被定义为“原生多模态”,这些多模态LLM在相关的介绍中,都用到了“视觉能力”、“视觉理解”这样的表述。 简单的理解,就是这些模型能够“看得见,并看得懂”,仿佛人的眼睛。为此,很多人…

    2024 年 7 月 25 日
    19400
  • Luma AI——引领AI行业进入高质量视频内容

    时隔不到一年,Luma AI又有新动作!!! Luma AI在当地时间6月12日官宣并发布新模型——Dream Machine。Dream Machine可以在120秒内生成120帧的视频,具备流畅的运动、电影摄影和戏剧效果。 去年11月,Luma AI在Discord服务器上推出了文生3D模型Genie,冲击了AI行业的一大突破口——3D生成。Luma A…

    2024 年 7 月 11 日
    28000
  • Runway Gen-3 Alpha图生视频上线,图片转视频只需要一步?!

    7月30日凌晨,Runway官方在社交媒体平台宣布,在6月中旬推出的视频模型Gen-3Alpha正式推出图生视频功能。官方表示,图生视频功能将极大提高了生成视频的艺术控制和一致性。 这一更新允许用户将任何图像用作视频生成的第一帧,可以单独使用,也可以与文本提示一起使用。 简单的说就是,用户上传一张图片可以单独生成一个视频,也可以在上传图片后搭配文字描述,再生…

    2024 年 8 月 2 日
    25800
  • 资讯丨302.AI正式上线客户端!三个版本可供选择

    随着技术的发展,AI正一点一点融入到我们的日常和生活中,成为我们工作和生活的重要辅助工具。为了给用户带来多样的AI服务体验,11月14日,302.AI正式上线桌面客户端,并提供了以下三个版本给用户选择: 主账户版:支持Windows、Mac系统 子账户版:支持Windows、Mac系统 极简版:仅支持Mac系统 版本介绍: 主账号版: (展示的界面以Wind…

    2024 年 11 月 14 日
    19100
  • 智谱发布的新一代基座模型GLM-4-Plus和GLM-4V-Plus表现如何?

    8月29日,智谱AI在KDD国际数据挖掘与知识发现大会上发布了新一代基座模型,包括语言模型GLM-4-Plus、图像/视频理解模型GLM-4V-Plus等。 GLM-4-Plus 基座模型,通过多种方式构造出了海量高质量数据,并利用 PPO等多项技术,有效提升了模型推理、指令遵循等方面的表现,能够更好地反映人类偏好。据官方称,GLM-4-Plus在各项指标上…

    2024 年 9 月 2 日
    29900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注