Gemini

302.AI 基准实验室 | DeepSeek-R1 vs. Gemini-Thinking vs. OpenAI-o1, 最新推理模型PK

原本以为“卷”了一年的AI大模型圈年末终于能暂歇一口气，但没想到最近几日接连有新模型发布。 1月20日晚，DeepSeek发布了推理模型–DeepSeek-R1。据官方介绍，DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI …
2025 年 1 月 23 日 • 基准实验室
1.9K10
302.AI 基准实验室 | 谷歌再发布实验模型Gemini 2.0 Flash Thinking，实测中能否正确解出考研数学题？！

12月20日凌晨，谷歌DeepMind首席科学家宣布推出全新模型——Gemini 2.0 Flash Thinking。据了解，Gemini 2.0 Flash thinking是一个实验性模型，它以Gemini 2.0 Flash版本为基础，经过特别训练后，能够在回答问题时展示其“思考过程”，这与o1模型的慢思维思考方式相似，可以深度可视化展示整个思维链…
2024 年 12 月 24 日 • 基准实验室
1.5K110
302.AI 基准实验室 | 谷歌突袭发布新模型Gemini 2.0 Flash实验版，原来这才是性价比之王？！

12月12日的凌晨，当OpenAI的“12天连续发布”活动如火如荼地进行到第五天时，谷歌在毫无预兆的情况下，带来了其新系列大模型：Gemini 2.0，而Gemini 2.0 Flash Exp，则是Gemini 2.0 系列模型中的第一个模型。虽然没有找到准确的参数，但据了解，Flash是Gemini模型序列中，除了专为端侧开发的Nano模型外，参数最小…
2024 年 12 月 12 日 • 基准实验室
1.1K01
302.AI 基准实验室 | 谷歌时隔一周发布的新模型gemini-exp-1121，实测竟发现模型能力出现了倒退？

时隔gemini-exp-1114发布仅一周，谷歌DeepMind在11月21日再次发布实验AI模型gemini-exp-1121。根据官方介绍，gemini-exp-1121在编码、推理和视觉能力都有提升。在gemini-exp-1121发布之后，它迅速赢得了Arena榜单的冠军宝座，根据测评结果显示，除了风格控制外，其他方面都位于第一。但在发布gem…
2024 年 12 月 3 日 • 基准实验室
1.0K80
302.AI 基准实验室 | DeepMind新模型Gemini-exp-1114模型霸榜第一？实测结果出人意料

11月15日，谷歌DeepMind推出Gemini-exp-1114，这是一个实验性模型。据了解，在经过6000+网友匿名投票后，Gemini-exp-1114模型在AI基准测试中位居总体排名第一，Gemini-exp-1114模型分数直涨40+，与GPT-4-latest并列第一，并超越了o1-preview。 Gemini-exp-1114在处理复杂提…
2024 年 11 月 18 日 • 基准实验室
1.1K00
302.AI 基准实验室 | 谷歌发布最新两款Gemini 1.5系列模型，与草莓o1模型对比谁表现更好？

9月25日，Google旗下的Gemini 1.5系列模型迎来了最新版本的发布，分别是Gemini-1.5-Pro-002和Gemini-1.5-Flash-002两款模型。据了解，与之前的版本相比，Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002在数学、上下文和视觉方面的能力得到了显著提升。根据官方数据显示，两款模型在M…
2024 年 9 月 26 日 • 基准实验室
1.1K00

2 / 2
1
2

Gemini

302.AI 基准实验室 | DeepSeek-R1 vs. Gemini-Thinking vs. OpenAI-o1, 最新推理模型PK

302.AI 基准实验室 | 谷歌再发布实验模型Gemini 2.0 Flash Thinking，实测中能否正确解出考研数学题？！

302.AI 基准实验室 | 谷歌突袭发布新模型Gemini 2.0 Flash实验版，原来这才是性价比之王？！

302.AI 基准实验室 | 谷歌时隔一周发布的新模型gemini-exp-1121，实测竟发现模型能力出现了倒退？

302.AI 基准实验室 | DeepMind新模型Gemini-exp-1114模型霸榜第一？实测结果出人意料

302.AI 基准实验室 | 谷歌发布最新两款Gemini 1.5系列模型，与草莓o1模型对比谁表现更好？