资讯丨如何1秒钟为大模型API增加长期记忆?限时免费体验!

众所周知,大模型是没有记忆的。从专业角度来解释,所有的大模型API都是无状态API(每个请求是自足的,不依赖于以前的请求或者状态,这样的API可以更容易地进行扩展)。但是想让AI真正的成为“人”,记忆又是必不可少的。

短期记忆的实现

现阶段比较普遍的大模型实现记忆方法,就是每次请求时,把聊天记录简单的塞入上下文,让大模型看了聊天记录再进行回答。

但是这么做,会有2个先天的弊端:

  1. 模型上下文有限,传入的聊天记录是有限的,大模型只能看到一小部分的记录。
  2. 如果传入大量的聊天记录,花费就上去了,而且每次对话传入的聊天记录有绝大部分都是重复的,造成了资源的浪费。

这种方法,我们统称为短期记忆。

短期记忆 vs. 长期记忆

由于以上的弊端,长期记忆的需求自然而然被提了出来。

短记忆的特点:

  • 维持当前对话的上下文,通常只针对一个会话。
  • 依赖对话历史或会话状态实现。
  • 受限于 token 长度(通常 4k 到 32k tokens)或会话时长。
  • 会话结束后,自动清空。

长记忆的特点:

  • 跨会话保存:不局限于当前对话。
  • 需要结构化存储和高效的检索机制。
  • 用于存储模式、偏好和历史互动信息。
  • 需要定期更新和维护。

1秒接入长期记忆功能

为了解决AI短期记忆的限制,302.AI为所有大模型增加了长期记忆功能此功能限时免费,只需支付原有的模型调用费用),这一功能由302的合作伙伴Memobase(https://www.memobase.io)提供支持。

接入的过程也非常的简单,在原有大模型API不变的情况下,请求增加一个userid参数即可

不带记忆的API请求:

资讯丨如何1秒钟为大模型API增加长期记忆?限时免费体验!

不带记忆的回答:

资讯丨如何1秒钟为大模型API增加长期记忆?限时免费体验!

带记忆的API请求:

资讯丨如何1秒钟为大模型API增加长期记忆?限时免费体验!

带记忆的回答:

资讯丨如何1秒钟为大模型API增加长期记忆?限时免费体验!

可以看到,在单个API请求完全不带上下文的情况下,AI通过我之前的自我介绍,识别出了我的身份。

此功能几乎支持所有大模型,无需创建用户,无需初始化,仅需一个userid即可,AI会自动化的通过聊天记录来提取和检索长期记忆。

长期记忆的原理

短期记忆是将聊天记录原封不动的传给大模型

长期记忆是通过收集对话信息,使用大模型提取用户的各种信息,如年龄、教育背景、兴趣和观点,生成用户画像,最后将用户画像通过系统提示词传递给大模型。

所以长期记忆是短期记忆的蒸馏,短期记忆是长期记忆的数据来源

302.AI和Memobase合作,简化接入流程,将初始化用户、同步聊天记录、提取记忆、检索记忆等操作全部自动化,仅需在API请求传递一个userid,即可解决所有问题。

背后的流程大致如下:

资讯丨如何1秒钟为大模型API增加长期记忆?限时免费体验!

在线测试

1、登录进入302.AI管理后台——点击使用API——选择API超市——分类中点击语言大模型——点击长期记忆

资讯丨如何1秒钟为大模型API增加长期记忆?限时免费体验!

2、点击【查看文档】进入API文档:

资讯丨如何1秒钟为大模型API增加长期记忆?限时免费体验!

资讯丨如何1秒钟为大模型API增加长期记忆?限时免费体验!

3、根据提供的模板按需填写参数,最后点击发送即可,以下是必填的三个参数:

model:表示要使用的模型ID名称,例如“gpt-4o-mini”

messages:以聊天格式生成聊天完成的消息。

userid:uuidV4格式的userid(注意:userid必须符合uuidV4标准,如果不符合,将不会执行记忆操作。uuid生成测试链接:https://www.gongjuwa.com/uuid/

资讯丨如何1秒钟为大模型API增加长期记忆?限时免费体验!

总结

302.AI通过API增加一个参数,为几乎所有大模型增加了长期记忆功能,为所有开发者带来了极大的便利,再次扩展了AI的使用场景。

而302.AI之所以能做到这一点,和Memobase全新的记忆架构密切相关,过去302.AI团队也尝试接入Mem0等记忆技术,但是速度过慢和成本过高,始终无法达到标准。而Memobase全新的记忆架构,让记忆检索速度提高了5倍,成本降低了5倍,302团队和Memobase团队一拍即合,联手为大家推出了这个功能,希望感兴趣的朋友,赶紧来试用吧。

Like (0)
302.AI302.AI
Previous 5天前
Next 16小时前

相关推荐

  • 资讯丨“Thinking Claude”prompt真的这么神?302带你实测揭秘看看

    最近,又一个prompt在网上火了起来,这一prompt名为“ Thinking Claude”,有网友称它为Claude3.5的神级prompt,而更让人意想不到的的是,这个prompt背后的作者,居然是一个十七岁的少年! “Thinking Claude”的核心在于它引导Claude进行一种更为“人性化”的思考方式,强调思维过程的自然流动,而非简单的结构…

    2024 年 11 月 15 日
    37200
  • 资讯丨教育行业AI应用的最佳实践——AI答题机

    AI教育浪潮已经到来,但许多教育工作者还在观望:怎么用?从哪开始? 我们的答案是这个最新制作的工具:AI答题机 —— 一个真实可落地的教育AI应用。它不只是一个demo,而是经过实战检验的最佳实践。简单,但够用;基础,但有效。 区别于普通对话机器人,本工具专注解题场景,配备习题管理系统,让习题解答更简单高效。 界面展示: (以下展示的界面为移动端) 302.…

    16小时前
    500
  • Midjourney新版本v6.1上线,人像逼真细节再升级

    7月的最后一天,Midjourney宣布推出最新版本v6.1,这一消息在创意和技术领域引起了广泛关注。那这一新版本对比前一版本对比有什么不同呢,下面一起来看看。 Midjourney v6.1做了一系列升级: 1、更好的生成一致性(人像的手臂、腿、身体,动植物等题材) 2、更高的图像质量(减少伪影、增强纹理等) 3、更准确、更多细节、更精确理解图像里边的细小…

    2024 年 8 月 5 日
    33300
  • 视频太长不想看怎么办?来试一试AI音视频总结工具

    7月,夸克推出AI搜索并升级“超级搜索框”,在搜索框中加入了多个强大并实用的AI功能。其中的AI视频总结工具,这一工具不仅可以基于视频生成文稿,还能分段总结、生成思维导图以及智能生成课件,辅助用户高效学习。来看看官网的演示: 然而,目前小编只在夸克移动端找到了AI视频总结工具,而且根据页面提示,这一AI视频总结工具仅支持:上传视频和网盘视频两种方式,这意味着…

    2024 年 8 月 7 日
    25700
  • 你真的会使用AI吗?CO-STAR超给力提示词框架,速看

    就在今年5月,新加坡政府科技局(GovTech)组织了首届 GPT-4 提示工程大赛,吸引了超过 400 名杰出的参与者。冠军获得者Sheila Teo分享了如何使用一些简单有效的技巧来优化对ChatGPT的使用。 对于AI使用者来说,结构化的提示词框架能够帮助我们以一种更系统、更明确的方式与 AI 交互。这种清晰性对于确保 AI 系统能准确理解用户的意图至…

    2024 年 7 月 12 日
    31700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注