DeepClaude 是近期备受关注的一个AI项目,它通过将 DeepSeek-R1 的链式推理与 Claude 3.5 Sonnet 的代码生成能力深度融合,形成了独特的双模型协同机制,从而实现了高质量内容的高效输出。
受DeepClaude的启发,302.AI推出了新功能:为所有大模型增加推理能力。
但与DeepClaude不同的是,302.AI的这一功能支持所有模型。
原理大致如下:
用户提出问题→交给DeepSeek-R1模型生成详细的思考过程→将这份思考过程与原始问题拼接,作为增强后的输入喂给原有模型→整合后模型输出答案。
这种推理能力的增强方式无需对原有模型进行重新训练或大幅修改,而是通过外部推理模块(如DeepSeek-R1)提供推理支持。在保留原有模型性能和优势的基础上,快速为其赋予强大的推理能力,实现功能的高效拓展。
最难得的是,这个机制是API层面实现的,接入时没有任何门槛,只需要改动模型名称即可。无论是客户端,还是代码中调用,可以迅速享受到DeepSeek-R1带来的推理能力加成。
效果示例:
1、推理模式
示例模型GPT-4:能够深入理解复杂的文本内容,并根据上下文生成连贯、合理的回答,但其在复杂推理任务中的局限性较为明显,且容易出现模型“幻觉”。
模型原始回答:
(表示信息不足,无法给出答案)
开启推理模式后:
(展示详细的思考过程,最后给出正确答案)
2、推理模式+联网搜索
示例模型GPT 3.5 turbo:纯文本模型,仅支持文本输入和输出在处理复杂的逻辑推理任务时表现较弱,知识截止日期为2023年,无法实时获取最新的信息。
模型原始回答:
(信息滞后回答错误,且模型直接给出答案无思考过程)
联网搜索+推理模式:
(模型通过联网搜索的信息,一步步进行思考推理,最后给出正确答案)
3、推理模式+图片分析+联网搜索:
此外,还可以将图片分析、联网搜索、推理模式三种功能结合。图片分析功能在聊天机器人中是默认的,直接发送图片即可进行分析,其他两个功能按需打开叠加使用即可。
示例模型GPT 3.5 turbo:纯文本模型,仅支持文本输入和输出在处理复杂的逻辑推理任务时表现较弱,知识截止日期为2023年,无法实时获取最新的信息。
推理模式+图片分析+联网搜索:
(准确给出答案,价格也正确)
如何在302.AI上使用:
在302.AI的聊天机器人和API超市中增加推理能力的详细步骤如下:
1、在聊天机器人中开启推理模式:
(1)选择使用机器人→聊天机器人→任意选择模型(示例中为gpt-4o)→创建聊天机器人;
(2)进入聊天机器人后,在页面对话框处可一键开启推理模式;
(3)可与联网搜索功能一起使用,同时点亮即可;
2、在API调用中开启推理模式
所有大模型后缀加上【-r1-fusion】,即可为模型增加推理能力
(1)依次点击:使用API→API超市→语言大模型→302.AI,选择查看文档进入
(2)进入相关文档后,可支持在线调试:
在线调试提供的参数中,按需修改模型名称后缀使用:
例如:gpt-4o → gpt-4o-r1-fusion
可以看到返响应中含有reasoning-content:
此功能和图片分析或联网搜索一起使用,同理只需要修改后缀:
例如:gpt-4o → gpt-4o-r1-fusion-web-search
总结
这种“先思考、后执行”的机制,不仅避免了直接对原模型进行昂贵的微调,甚至能让老旧模型焕发新生,就像给手机安装了一个无需刷机的“智能大脑插件”。结合联网搜索、图片分析等功能,推理模式的应用范围更是得到了极大的扩展。