302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

由于AI训练的特殊性,现阶段大模型都存在以下三个问题:

  1. 大部分大模型都是瞎子
  2. 所有大模型都是离线的
  3. 所有大模型都是没有记忆的

针对这三个问题,市面上有非常多的工程的解决方案,但是都比较繁琐。

302.AI平台,为了让开发者和用户可以快速地解决这几个问题,我们在API调用层面做了几个升级,下面就来详细的讲一讲。


超便捷为大模型装上眼睛

大模型在行业里可以分为两类:

  1. 纯文字模型:只能处理文字的输入和输出。大部分的模型均是纯文字模型,例如DeepSeek-R1
  2. 多模态模型:可以处理多种类型的输入和输出,例如图片,语音等。典型的多模态模型有gpt-4o

由于多模态模型训练对数据集和算法的要求非常高,所以现阶段大部分的模型都是纯文字模型。

现在在302.AI,所有大模型后缀加上【-ocr】,即可将纯文字模型”变为“多模态模型了

例如:gpt-3.5-turbo -> gpt-3.5-turbo-ocr

示例:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

众所周知,gpt-3.5-turbo是一个纯文字模型,但是图中加了-ocr后缀后,就可以识别图片了。

其实背后的原理也很简单,如图例所示:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

简单地说,就是当纯文字模型接收到图片时,会借助另一个多模态模型,将图片解析为文字,再合并上下文一起进行输出。

综合速度和成本的考虑,默认的多模态模型为gpt-4o-mini。

此模型也可以在API中自己定义,修改ocr_model参数即可,如图:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

具体的API教程可查看:https://doc.302.ai/api-260114404


给大模型插上网线

大模型的训练过程是对大量的数据进行学习和训练,对数据格式的要求很高,计算能源的消耗也很高,所以无法做到训练数据及时的更新。现在大部分大模型的数据还停留在2023年底,换句话说,大模型对2024年发生了什么一无所知。形象地说,就像一个被关进监狱一年的人,对世界的认知还停留在一年前。

但是日常在应用AI的时候,如果无法了解最新的信息,很多任务是会出现问题的。

现在在302.AI,所有大模型后缀加上【-web-search】,模型将会先联网搜索再进行回答。

例如:gpt-4o-> gpt-4o-web-search

下面举一个例子,我们问gpt-4o,2025年美国总统是谁:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

(可以看到,大模型的知识还停留在2023年)

此时我们加上-web-search后缀:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

(回答正确)

背后的原理,如图所示:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

简单地说,就是当模型接收到用户输入时,会先进行搜索,再将结果合并上下文一起进行输出。此时模型就有了最新的信息。

现阶段每次输入都会进行搜索,未来我们会不断的改进逻辑,希望可以做到只在必要的时候进行搜索。

具体的API教程可查看:https://doc.302.ai/api-260112819


给大模型增加记忆

众所周知,大模型是没有记忆的。从专业角度来解释,所有的大模型API都是无状态API(每个请求是自足的,不依赖于以前的请求或者状态,这样的API可以更容易地进行扩展)。

302.AI和Memobase进行了合作,为所有大模型增加了长期记忆功能,增加一个userid参数即可:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

背后的原理大致如下:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

具体的教程可以查看这篇文章(https://mp.weixin.qq.com/s/EvqWU-LuqJsMpjLV9SH39w?token=1847659872&lang=zh_CN),这里不再复述。


在第三方应用的使用

考虑到用户除了会直接使用我们的聊天机器人外,还会通过ChatBox、Cherry Studio、Lobechat等第三方应用接入我们的API,我们将功能开关集成到模型名称中,以实现更灵活的功能配置。

下面将以Cherry Studio作为例子:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

可以见到在配置中,我们加入了一个gpt-3.5-turbo-ocr的模型。注意需要打开图像类别:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

此时,就可以使用这个模型进行图片问答了:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

我们再加入一个联网的gpt-4o试试:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

检验一下:

302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能!

关于记忆功能,由于需要更改请求参数,现有的第三方平台暂不支持,还期待各位开发者尽快兼容啦。


总结

回到开头的三个问题:

  1. 大部分大模型都是瞎子
  2. 所有大模型都是离线的
  3. 所有大模型都是没有记忆的

现在在302.AI平台,我们给出了三个最便捷的解决方案:

  1. 模型名称增加-ocr后缀,就给模型装上了眼睛,例如gpt-3.5-turbo改为gpt-3.5-turbo-ocr
  2. 模型名称增加-web-search后缀,就给模型插上了网线,例如gpt-4o改为gpt-4o-web-search
  3. 模型请求增加userid字段,就给模型增加了记忆

三个解决方案全部都是即插即用的API升级,无需额外开发成本,兼容大部分开源项目和第三方应用。

还有些黑科技正在紧锣密鼓开发中,很快就能和大家见面啦:

  1. 给所有模型增加文件解析功能
  2. 给所有模型增加function call功能
  3. 给所有模型增加深度思考功能

敬请期待!


免费试用302.AI,开启你的AI之旅!👈

为什么选择302.AI?

● 灵活付费:无需月费,按需付费,成本可控
● 丰富功能:从文字、图片到视频,应有尽有,满足多种场景需求
● 开源生态:支持开发者深度定制,打造专属AI应用
● 易用性:界面友好,操作简单,快速上手

302.AI 新品发布 | 图像创意站:GPT-Image-1玩法全解析,轻松生成惊艳作品

All Rights Reserved by 302.AI
Like (1)
302.AI302.AI
Previous 2025 年 2 月 12 日 下午10:35
Next 2025 年 2 月 14 日 下午7:22

相关推荐

  • 302.AI 赛博月刊丨Vol.8 攻守易形:当开源变成中国主场

    AI 行业大事记 2025 年 8 月 联合出品: Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心 说明: ①本文讨论了 2025 年7月 AI行业的 103 件大事,涵盖模型、图像、视频、音频、3D、机器人、应用、新闻/融资等多个领域。 ② 本文分类中的「模型」均指代语言模型; ③ 本文分类中的「融资」包含了融资、收购、团队成…

    11小时前 赛博月刊
    360
  • 302.AI 基准实验室丨从视觉语言到GUI交互:智谱GLM-4.5V挑战顶级闭源模型实测

    视觉语言大模型(VLM)作为智能系统的核心基础,正在不断从基础的“识别”向更深层的“推理”跃迁。今年上半年,多模态大模型在视觉领域呈现百花齐放之势,各厂商竞相布局。然而,视觉能力的下一站是“推理”——不满足于让模型读图后回答“这是什么”,更需其调用推理能力理解背后的意图与情境。这种对视觉逻辑和上下文的理解能力,既是实现通用人工智能(AGI)的关键一步,也是构…

    3天前 基准实验室
    1551
  • 302.AI 基准实验室丨GPT-5评测:没能炸场,却精准打脸了竞品:便宜、能打,还不装

    尘埃落定,当地时间 8 月 7 日,OpenAI 终于发布了最新的旗舰 AI 模型 GPT-5。OpenAI 宣称,GPT-5 是其迄今为止最智能、最快、最实用的模型,在编码、数学、写作、健康、视觉感知等领域均展现出卓越的性能。首席执行官 Sam Altman 将 GPT-5 形容为一次“重大升级”,称与其对话“就像在与某个领域的博士级专家交流”。 GPT-…

    2025 年 8 月 8 日 基准实验室
    8631
  • 302.AI 基准实验室丨开源新SOTA? Open AI GPT-OSS系列模型对决国产开源模型评测

    2025 年 8 月 5 日,OpenAI 突袭发布了两款全新的开源推理模型——gpt-oss-120b 和 gpt-oss-20b。这是 OpenAI 自 2019 年 开源 GPT-2 以来,时隔 6 年首次重返开源生态。 本次开源的 gpt-oss 系列包含两个高性能版本,均采用混合专家架构(MoE) 与 Apache 2.0 开源许可,支持自由修改、…

    2025 年 8 月 6 日 基准实验室
    1.5K0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Comments(13)

  • […] (1)超便捷!教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记忆功能 […]

  • Wan Harfert
    Wan Harfert 2025 年 6 月 4 日 下午1:53

    Great blog! Is your theme custom made or did you download it from somewhere? A theme like yours with a few simple tweeks would really make my blog shine. Please let me know where you got your design. Appreciate it

  • réserver un vtc
    réserver un vtc 2025 年 6 月 6 日 上午10:04

    Exactly what I was searching for, thanks for putting up.

  • drover sointeru
    drover sointeru 2025 年 6 月 8 日 上午11:40

    obviously like your website but you have to take a look at the spelling on quite a few of your posts. A number of them are rife with spelling problems and I in finding it very troublesome to tell the truth then again I’ll definitely come again again.

  • […] 302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记… 302.AI 实战教程 | 《哪吒2》火爆出圈!如何用3D建模工具快速复刻出哪吒? 302.AI 新品发布 | 如何1秒钟为大模型API增加长期记忆?限时免费体验! All Rights Reserved by 302.AI AICGAI应用AI生图AI视频Deepseek Like (0) 302.AI 0 Generate poster 302.AI 新品发布丨语音竞技场:AI语音模型“神仙打架”!200+音色任选,测评+生成全搞定 Previous 2天前 302.AI 新品发布 | 视频太长不想看怎么办?来试一试AI音视频总结工具 Next 2024 年 8 月 7 日 下午6:47 […]

  • Waylon Mathiesen
    Waylon Mathiesen 2025 年 6 月 16 日 下午4:32

    Valuable info. Lucky me I found your web site by accident, and I’m shocked why this accident did not happened earlier! I bookmarked it.

  • Garland Kunsman
    Garland Kunsman 2025 年 6 月 30 日 上午3:35

    Great write-up, I’m normal visitor of one’s site, maintain up the excellent operate, and It is going to be a regular visitor for a lengthy time.

  • Shila Acock
    Shila Acock 2025 年 6 月 30 日 下午12:38

    I’d have to examine with you here. Which is not one thing I usually do! I take pleasure in reading a post that may make folks think. Additionally, thanks for permitting me to comment!

  • […] 302.AI 把科普视频做成爆款,小白轻松上手! 302.AI 实战教程 | 教你如何1秒为所有大模型API增加图片分析/联网搜索/长期记… 302.AI 实战教程 | 《哪吒2》火爆出圈!如何用3D建模工具快速复刻出哪吒? […]

  • website link
    website link 2025 年 7 月 6 日 下午10:39

    Really informative and great bodily structure of subject matter, now that’s user genial (:.

  • Hawaii medical malpractice lawyer
    Hawaii medical malpractice lawyer 2025 年 7 月 24 日 上午9:06

    F*ckin’ remarkable things here. I am very glad to see your article. Thanks so much and i’m looking forward to touch you. Will you please drop me a mail?

  • hptoto
    hptoto 2025 年 8 月 16 日 上午7:15

    As a Newbie, I am constantly exploring online for articles that can help me. Thank you

  • macau jitu
    macau jitu 2025 年 8 月 16 日 下午12:15

    Simply wish to say your article is as astounding. The clearness in your post is simply cool and i could assume you are an expert on this subject. Fine with your permission let me to grab your RSS feed to keep updated with forthcoming post. Thanks a million and please continue the rewarding work.