LLM

  • 302.AI 新品发布 | DeepClaude好用么?来302.AI试试DeepAnyLLM

    DeepClaude 是近期备受关注的一个AI项目,它通过将 DeepSeek-R1 的链式推理与 Claude 3.5 Sonnet 的代码生成能力深度融合,形成了独特的双模型协同机制,从而实现了高质量内容的高效输出。 受DeepClaude的启发,302.AI推出了新功能:为所有大模型增加推理能力。 但与DeepClaude不同的是,302.AI的这一功…

    2025 年 3 月 5 日 新品发布
    3533
  • 302.AI 基准实验室 | Claude 3.7 Sonnet 标准模式和推理模式实测对比

    在上一篇文章中,我们给大家介绍了 Claude 3.7 Sonnet 模型,同时对Claude 3.7 Sonnet的标准模式(Normal)进行了实测对比。 而现在,我们将会对Claude 3.7 Sonnet 推理模式(Extended)进行深入探讨。通过与Claude 3.5 Sonnet、Claude 3.7 Sonnet(标准模式)的对比,更全面地…

    2025 年 2 月 27 日 基准实验室
    8700
  • 302.AI 基准实验室 | 实测Anthropic首款混合推理模型——Claude 3.7 Sonnet,程序员的外挂来了?!

    2月25日凌晨,Anthropic发布了首款混合推理模型——Claude 3.7 Sonnet。 Claude 3.7 Sonnet 能够在标准模式(Normal) 下既提供近乎即时的响应,也可以也能切换到扩展思考模式(Extended),进行详细的逐步推理。 在扩展思考模式的加持下,Claude 3.7 Sonnet 在数学、物理、指令遵循、编码等方面获得…

    2025 年 2 月 25 日 基准实验室
    2710
  • 302.AI 基准实验室 | 马斯克号称地表最强的Grok 3系列模型,在实测中到底能否超越R1和o3-mini?

    2月19日,马斯克旗下的大模型平台 xAI 推出了新的模型——Grok-3。官方宣称,Grok-3 在推理、数学、编码和指令遵循任务中均表现出色,并在一系列基准测试中表现出色。而马斯克更是称一模型为 ⌈ 地表最强 ⌋。 (非推理模式的Grok-3与其它大模型能力对比) 根据了解,grok-3 并非单一模型,而是一个包含多个版本的模型家族。其中包括了变体版本—…

    2025 年 2 月 24 日 基准实验室
    3130
  • 302.AI 新品发布 | 代码竞技场:大模型编程能力的“超级擂台”

    一个大模型能力强不强,我们常常会从多个维度去评估,其中编程能力是尤为关键的一项。 对于许多用户而言,想要准确测试大模型的代码能力却常常不知道该从何入手,或者不知道选择哪个平台进行测试。 为了帮助用户解决这一问题,302.AI最新上线了一款工具——代码竞技场,这一工具集结了多种先进模型,为用户提供了一个广阔、便捷、易用的代码测试平台。 代码竞技场工具界面展示:…

    2025 年 2 月 19 日 新品发布
    2800
  • 302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

    由于AI训练的特殊性,现阶段大模型都存在以下三个问题: 针对这三个问题,市面上有非常多的工程的解决方案,但是都比较繁琐。 在302.AI平台,为了让开发者和用户可以快速地解决这几个问题,我们在API调用层面做了几个升级,下面就来详细的讲一讲。 超便捷为大模型装上眼睛 大模型在行业里可以分为两类: 由于多模态模型训练对数据集和算法的要求非常高,所以现阶段大部分…

    2025 年 2 月 13 日 实战教程
    4911
  • 302.AI 基准实验室 | o3-mini vs. Gemini 2.0 pro vs. DeepSeek-R1实测对比

    自年前DeepSeek发布R1模型后便迅速引发了各界的广泛关注。 最近,各模型厂家都坐不住了,频频出招。 先是1月底,是OpenAI正式发布 o3-mini,这是OpenAI推理系列中最新、最具成本效益的模型。该模型支持低、中、高三档推理难度,并针对科学、数学、编程等领域进行了优化。 2月6日,谷歌也加入了 DeepSeek 、OpenAI 的战局,发布多个…

    2025 年 2 月 10 日 基准实验室
    6620
  • 302.AI 深度拆解 | 大白话聊一聊: 50美金复刻DeepSeek R1? 解密背后真正的事实

    一则新闻 今天猛然看到一则新闻标题,大意是李飞飞团队仅用 50 美金就复刻出了一个媲美 R1 的模型。我的第一反应是「不可能,又是什么标题党」;第二反应是「数据应该不是凭空捏造的,索性求证一下?」 然后,我找到了原始论文《s1: Simple test-time scaling》(https://arxiv.org/pdf/2501.19393)。仔细拜读之…

    2025 年 2 月 7 日 深度拆解
    4430
  • 302.AI 深度拆解 | 大白话聊一聊:Deepseek R1背后的来龙去脉! 2025年AI圈必读

    文 | Jomy @302.AI 编 | 南乔River @ShowMeAI I. 一切的开端 CloseAI在24年发布了o1,指出了未来Scaling Law的方向:增加思考时间来换取更多智能,而不是用更大的模型或更多的训练数据。CloseAI没告诉任何人具体该怎么做,只是将自己的成果做成了收费产品。 虽然大家都知道了这个宏观方向,但是不知道具体的实现方…

    2025 年 2 月 5 日 深度拆解
    2611
  • 302.AI 基准实验室 | DeepSeek-R1 vs. Gemini-Thinking vs. OpenAI-o1, 最新推理模型PK

    原本以为“卷”了一年的AI大模型圈年末终于能暂歇一口气,但没想到最近几日接连有新模型发布。 1月20日晚,DeepSeek发布了推理模型–DeepSeek-R1。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI …

    2025 年 1 月 23 日 基准实验室
    6330