302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

3月21日晚,腾讯宣布混元大模型系列的深度思考模型已成功升级为混元-T1正式版。据官方介绍,该模型基于腾讯3月初发布的业界首个超大规模 Hybrid-Transformer-Mamba MoE 大模型TurboS快思考基座,通过大规模训练显著扩展了推理能力,并进一步对齐人类偏好。

在MMLU-pro、CEval、AIME、Zebra Logic等中英文知识、竞赛级数学,以及逻辑推理公开基准测试中, Hunyuan-T1 均获得比肩 DeepSeek R1 和 OpenAI o1 的分数

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

302.AI现已接入Hunyuan-T1正式版的最新版本: Hunyuan-T1-Latest 。这是官方推荐使用的版本。今天,我们把 Hunyuan-T1-Latest 与同样具备思考推理能力的 QwQ-32B 、DeepSeek-R1 模型进行对比,带大家更直观地了解 Hunyuan-T1-Latest 模型的优劣。


Hunyuan-T1-Latest vs. QwQ-32B vs. DeepSeek-R1 模型实测

实测1:空间问题

提示词:7米长的竹竿可以通过高3米宽3米的门吗?

考察点:测试模型的空间想象力以及几何推理能力。

总结:三个模型均未给出正确答案,未考虑竹竿可以与地面平行且与门垂直通过的可能。

QwQ-32B :回答错误。

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

DeepSeek-R1:DeepSeek也未能给出正确答案

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

Hunyuan-T1-Latest:只考虑对角线通过的情况,回答错误

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

实测2:中文理解

提示词:“校服上别别别的”里的三个“别”分别是什么意思?

考察点:这一题目主要测试模型在特定语境中的中文词语理解。

总结:QwQ-32B 和 DeepSeek-R1在前两个“别”字的理解上混淆了,只有Hunyuan-T1-Latest完全理解正确。

QwQ-32B :第一第二个“别”字意思有点混淆,不过完整的句子理解倒是正确的。

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

DeepSeek-R1:同样第一个字与第二个字的理解混淆了,整句理解也稍有偏差

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

Hunyuan-T1-Latest:三个字理解完全正确!

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

实测3:逻辑推理:

提示词:

老师发给甲、乙、丙三张扑克牌,老师说:“你们三个人拿到的数字和是14,并且没有鬼牌。其中,J、Q、K、A分别代表11、12、13、1。你们只能看自己的牌,能猜出其他两人拿到的是什么数字吗?”

甲:“我只知道乙丙两人的数字一定不同。”

乙:“其实一开始我就知道咱们三个人的数字一定不同。”

丙:“我知道你们俩拿到的数字了。”

请问,丙拿到什么数字了呢?

考察点:这个题目考察的是模型的问题解决能力和逻辑推理能力。

总结:QwQ-32B和DeepSeek-R1回答错误,只有 Hunyuan-T1-Latest 给出了清晰的解释和正确的答案。

QwQ-32B :答案错误,分析过程让人读起来云里雾里的,不够清晰

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

DeepSeek-R1:经过漫长等待后,最后输出的答案是错误的。

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

Hunyuan-T1-Latest:解析过程很清晰,答案正确

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

实测4:编程效果

提示词:制作一个含有春天元素的贪吃蛇小游戏,需要包含“开始游戏”按钮以及游戏说明

总结:结合界面美观度、运行效果、提示词遵循等方面综合比较,表现最好的是DeepSeek-R1,其次则是Hunyuan-T1-Latest。

QwQ-32B :游戏说明虽表明是用键盘操作游戏,但是尝试使用键盘后游戏动画随即停止,这一逻辑存在问题,呈现效果欠佳

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

DeepSeek-R1:提示词遵循准确,界面涵盖了“开始游戏”按钮以及游戏说明,界面美观度高,实操未出现bug,整体表现很好

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

Hunyuan-T1-Latest:提示词中提到的“游戏说明”未在效果中展示,但界面美观度和可操作性方面表现不错。

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

实测总结

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

综合以上实测,我们可以初步得出以下结论:

(1)推理模型显“人机感”

从实测1空间问题测试中可以得出:尽管这三个模型均属于可进行思考推理的模型,但在应对这类涉及人生活常识的问题时,它们的回答还是不够灵活,具有一定的“人机感”。

(2)Hunyuan-T1-Latest在中文语境理解上强于其他实测模型

在中文理解的测试中,Hunyuan-T1-Latest表现突出,能够准确理解语境中的“别”字含义,而其他两个模型则存在混淆。这表明Hunyuan-T1-Latest较其他两个模型在中文语境理解上理解能力更强。

(3)Hunyuan-T1-Latest表现惊艳,QwQ-32B和DeepSeek-R1 较为逊色

在逻辑推理的测试中,Hunyuan-T1-Latest提供了清晰的分析过程并给出了正确答案。相较之下,QwQ-32B 和DeepSeek-R1 的表现则显得较为逊色,未能推理出正确答案。

(4)DeepSeek-R1 编程综合表现最佳

在编程效果的实测中,DeepSeek-R1综合表现上略胜一筹,展示了出色的界面美观度和操作性,Hunyuan-T1-Latest虽然表现不错,但在游戏说明的展示上有所欠缺。QwQ-32B的表现相对较差,存在逻辑问题和用户体验不佳的情况。

(5)Hunyuan-T1-Latest 推理速度领先R1

综合各轮实测的思考时间,我们意外发现 Hunyuan-T1-Latest 在推理速度上优势明显,比 DeepSeek-R1 更快,不过与小参数模型 QwQ-32B 对比还是有一定的差距。


在302.AI上使用Hunyuan-T1-Latest模型

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!

302.AI 基准实验室 | 国产推理模型Hunyuan-T1-Latest实测:速度提升,推理与中文理解表现惊艳!


👉立即注册免费试用302.AI,开启你的AI之旅!👈

为什么选择302.AI?

● 灵活付费:无需月费,按需付费,成本可控
● 丰富功能:从文字、图片到视频,应有尽有,满足多种场景需求
● 开源生态:支持开发者深度定制,打造专属AI应用
● 易用性:界面友好,操作简单,快速上手

302.AI 新品发布 | 图像创意站:GPT-Image-1玩法全解析,轻松生成惊艳作品

All Rights Reserved by 302.AI
Like (1)
302.AI302.AI
Previous 2025 年 3 月 22 日 上午10:57
Next 2025 年 3 月 27 日 上午11:02

相关推荐

  • 302.AI 基准实验室丨编程能力超越Claude Opus 4?DeepSeek V3.1最新版本实测

    DeepSeek 昨晚在 Hugging Face 发布了其最新升级模型 DeepSeek-V3.1-Base。这次更新并没有任何预热宣传,甚至没有放上模型卡。唯一已知的信息是:上下文窗口从原有的64k扩展至128k,从网页、App、小程序都可体验这一模型。从上传的模型版本看,模型尺寸达 685B,支持 BF16、F8_E4M3、F32 等张量类型,平衡模型…

    2025 年 8 月 20 日 基准实验室
    8290
  • 302.AI 赛博月刊丨Vol.8 攻守易形:当开源变成中国主场

    AI 行业大事记 2025 年 8 月 联合出品: Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心 说明: ①本文讨论了 2025 年7月 AI行业的 103 件大事,涵盖模型、图像、视频、音频、3D、机器人、应用、新闻/融资等多个领域。 ② 本文分类中的「模型」均指代语言模型; ③ 本文分类中的「融资」包含了融资、收购、团队成…

    2025 年 8 月 18 日 赛博月刊
    3450
  • 302.AI 基准实验室丨从视觉语言到GUI交互:智谱GLM-4.5V挑战顶级闭源模型实测

    视觉语言大模型(VLM)作为智能系统的核心基础,正在不断从基础的“识别”向更深层的“推理”跃迁。今年上半年,多模态大模型在视觉领域呈现百花齐放之势,各厂商竞相布局。然而,视觉能力的下一站是“推理”——不满足于让模型读图后回答“这是什么”,更需其调用推理能力理解背后的意图与情境。这种对视觉逻辑和上下文的理解能力,既是实现通用人工智能(AGI)的关键一步,也是构…

    2025 年 8 月 15 日 基准实验室
    4441
  • 302.AI 基准实验室丨GPT-5评测:没能炸场,却精准打脸了竞品:便宜、能打,还不装

    尘埃落定,当地时间 8 月 7 日,OpenAI 终于发布了最新的旗舰 AI 模型 GPT-5。OpenAI 宣称,GPT-5 是其迄今为止最智能、最快、最实用的模型,在编码、数学、写作、健康、视觉感知等领域均展现出卓越的性能。首席执行官 Sam Altman 将 GPT-5 形容为一次“重大升级”,称与其对话“就像在与某个领域的博士级专家交流”。 GPT-…

    2025 年 8 月 8 日 基准实验室
    1.1K1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Comments(22)

  • Eddie Mcmann
    Eddie Mcmann 2025 年 6 月 4 日 下午4:16

    I’ve read some just right stuff here. Definitely value bookmarking for revisiting. I wonder how much attempt you set to make this sort of wonderful informative site.

  • career growth through leadership skills
    career growth through leadership skills 2025 年 6 月 11 日 上午3:17

    Great site. Plenty of useful info here. I?¦m sending it to a few pals ans additionally sharing in delicious. And of course, thank you on your sweat!

  • vorbelutrioperbir
    vorbelutrioperbir 2025 年 6 月 12 日 上午8:32

    Hi! I could have sworn I’ve been to this blog before but after browsing through some of the post I realized it’s new to me. Anyhow, I’m definitely happy I found it and I’ll be book-marking and checking back often!

  • Edwardo Obanner
    Edwardo Obanner 2025 年 6 月 16 日 下午5:28

    Merely wanna input that you have a very decent web site, I enjoy the style and design it actually stands out.

  • Live Motorsport Streaming
    Live Motorsport Streaming 2025 年 6 月 23 日 下午1:42

    fabuloso este conteúdo. Gostei muito. Aproveitem e vejam este site. informações, novidades e muito mais. Não deixem de acessar para se informar mais. Obrigado a todos e até a próxima. :)

  • Tarsha Borghese
    Tarsha Borghese 2025 年 7 月 2 日 上午5:38

    Excellent blog here! Also your web site loads up fast! What host are you using? Can I get your affiliate link to your host? I wish my site loaded up as quickly as yours lol

  • Hawaii medical malpractice lawyer
    Hawaii medical malpractice lawyer 2025 年 7 月 24 日 上午9:28

    Exactly what I was searching for, regards for putting up.

  • computer cable installers near me san Antonio,tx
    computer cable installers near me san Antonio,tx 2025 年 7 月 30 日 上午5:32

    Sweet blog! I found it while searching on Yahoo News. Do you have any tips on how to get listed in Yahoo News? I’ve been trying for a while but I never seem to get there! Thanks

  • pet transportation services in delhi ncr
    pet transportation services in delhi ncr 2025 年 8 月 13 日 下午4:55

    Great write-up, I am normal visitor of one’s blog, maintain up the excellent operate, and It’s going to be a regular visitor for a lengthy time.

  • togel online
    togel online 2025 年 8 月 16 日 下午4:41

    great post, very informative. I ponder why the opposite specialists of this sector don’t realize this. You should continue your writing. I am sure, you have a huge readers’ base already!

  • bandar macau
    bandar macau 2025 年 8 月 18 日 下午8:10

    Hey, you used to write fantastic, but the last few posts have been kinda boringK I miss your great writings. Past several posts are just a little out of track! come on!

  • reabilitação
    reabilitação 2025 年 8 月 20 日 上午12:21

    Wonderful goods from you, man. I’ve remember your stuff prior to and you’re simply too magnificent. I actually like what you have obtained here, certainly like what you are stating and the way in which through which you are saying it. You make it enjoyable and you still care for to stay it sensible. I cant wait to read much more from you. That is actually a great website.

  • Soulmate Sketch
    Soulmate Sketch 2025 年 8 月 20 日 上午12:29

    you’re really a good webmaster. The website loading speed is incredible. It seems that you are doing any unique trick. Also, The contents are masterpiece. you have done a great job on this topic!

  • Prozenith
    Prozenith 2025 年 8 月 20 日 上午6:30

    Keep up the wonderful piece of work, I read few articles on this site and I think that your site is real interesting and has got circles of good info .

  • macan empire
    macan empire 2025 年 8 月 20 日 上午9:02

    Thank you for sharing excellent informations. Your site is so cool. I am impressed by the details that you?¦ve on this site. It reveals how nicely you perceive this subject. Bookmarked this web page, will come back for more articles. You, my friend, ROCK! I found simply the information I already searched all over the place and simply couldn’t come across. What a perfect web-site.

  • Escalade de bloc centre-ville Montréal
    Escalade de bloc centre-ville Montréal 2025 年 8 月 20 日 上午9:43

    Keep functioning ,terrific job!

  • Dentiste Chicoutimi
    Dentiste Chicoutimi 2025 年 8 月 20 日 下午12:51

    I’ll right away take hold of your rss as I can’t find your email subscription hyperlink or e-newsletter service. Do you’ve any? Please let me understand in order that I could subscribe. Thanks.

  • Free Baseball Streaming Website
    Free Baseball Streaming Website 2025 年 8 月 20 日 下午8:49

    Este site é realmente demais. Sempre que acesso eu encontro coisas diferentes Você também vai querer acessar o nosso site e saber mais detalhes! informaçõesexclusivas. Venha descobrir mais agora! :)

  • Live CFL Stream
    Live CFL Stream 2025 年 8 月 21 日 上午1:52

    Este site é realmente demais. Sempre que consigo acessar eu encontro coisas incríveis Você também vai querer acessar o nosso site e saber mais detalhes! Conteúdo exclusivo. Venha saber mais agora! :)

  • football live Qatar
    football live Qatar 2025 年 8 月 21 日 上午7:08

    Este site é realmente fascinate. Sempre que acesso eu encontro coisas diferentes Você também pode acessar o nosso site e saber mais detalhes! Conteúdo exclusivo. Venha descobrir mais agora! :)

  • pestoto
    pestoto 2025 年 8 月 21 日 下午6:11

    I’ve been exploring for a bit for any high quality articles or weblog posts in this sort of space . Exploring in Yahoo I eventually stumbled upon this website. Studying this info So i am glad to convey that I’ve an incredibly excellent uncanny feeling I came upon exactly what I needed. I so much unquestionably will make sure to don’t overlook this website and provides it a look regularly.

  • unblocked games
    unblocked games 2025 年 8 月 22 日 上午12:37

    Hiya, I’m really glad I’ve found this information. Today bloggers publish just about gossips and web and this is really frustrating. A good blog with exciting content, this is what I need. Thanks for keeping this web-site, I will be visiting it. Do you do newsletters? Cant find it.