什么是RAG?什么是GraphRAG?一文带你读懂知识库机器人原理

在人工智能领域,知识库机器人已经成为推动智能化发展的重要力量。它们能够高效地处理海量信息,为用户提供精准、及时的知识服务。今天,我们将一起揭开知识库机器人的神秘面纱,探讨知识库机器人的原理。

什么是RAG?

知识库的整套技术在学术界有一个专业名词,叫RAG,即Retrieval-Augmented Generation,翻译成中文就是检索信息增强,是一种将信息检索机制与AI模型结合的创新方法。

RAG还有一个通俗的叫法,叫外挂知识库。外挂的含义就是,和AI大模型是分离的。如果不分离,那就是模型微调了,又是另外一回事了。

RAG的原理

RAG的原理其实很简单,就是模型生成回答时,不是自己直接生成,而是先去查一下知识库,再进行生成。通俗的来说,就是开卷考试(RAG)和闭卷考试(直接生成)的差别。

从流程上来说,绝大多数RAG可以分为这3步:

1、创建知识库

  (1)输入数据(上传文件)

  (2)处理数据(切片+向量化)

  (3)存储数据(存到向量数据库)

2、查询知识库

  (1)搜索数据(向量检索)

  (2)处理数据(重排序)

  (3)输出数据(挑选相关性高的)

3、AI生成答案

什么是RAG?什么是GraphRAG?一文带你读懂知识库机器人原理

通俗的来说,就是将一个巨大的数据,切成很多小块,当AI进行问答时,搜索出关联性高的小块,根据这些小块的内容进行回答。这样的好处就是:AI不需要处理大量的数据,只需要处理很少量的数据就可以了,提高了速度,降低了成本。

但是劣势也是很明显的,就是断章取义。由于AI只拿到了部分数据,无法看到全局,所以这是RAG的天然劣势。

什么是RAG?什么是GraphRAG?一文带你读懂知识库机器人原理

RAG的关键

RAG的本质就是断章取义,那么怎么断,怎么取,就决定回答的质量,在整个过程中,AI的作用其实是很小的。关键是在第一和第二步中,也就是数据处理数据检索。

数据处理的关键是如何切片,302.AI提供了非常丰富的切片设置,具体可以看这一篇文章:https://help.302.ai/docs/ru-he-jin-xing-qie-pian-you-hua。

数据检索的关键是如何找到关联性大的内容,302.AI采用了双重检索的机制,先使用向量检索粗检索,再用重排序算法(rerank)精检索,最后输出到大模型,大大提高了精度。

GraphRAG

GraphRAG是微软提出的一种新式的RAG技术,原理就是在数据输入阶段,用AI对数据进行了图谱化处理,让AI去理解数据,建立数据语义的关联,使检索精度大大提高。

GraphRAG的本质,是在原有的数据基础上,用AI创造了新的数据。这种新的数据是通过构建知识图谱来实现的,这不仅有助于更好地组织和存储信息,还能使AI在进行检索时能够更智能地识别和推理数据之间的关系。这种方法有效地提升了信息检索的准确性和效率,使得系统在处理复杂查询时表现得更加出色。此外,GraphRAG的图谱化处理还可以帮助发现数据中的隐藏模式和趋势,从而为用户提供更深刻的洞察和决策支持。

什么是RAG?什么是GraphRAG?一文带你读懂知识库机器人原理

GraphRAG也不是没有缺点的,第一就是会比较贵,因为在数据录入的过程中,需要AI进行处理,一定会产生AI的费用。第二就是比传统RAG要慢,因为检索图谱的过程会复杂很多。

302.AI现已独家提供GraphRAG的知识库接入和API接入,代码基于Nano-GraphRAG开发,更加轻量化。

知识库的原理就是AI先查询再回答。那么如何查询到关联性高的片段,就是知识库最核心的部分。302.AI提供了2种模式:传统RAG和GraphRAG,可以根据需求去选择,下面将简单展示一下如何使用302.AI的知识库机器人:

什么是RAG?什么是GraphRAG?一文带你读懂知识库机器人原理

选择好后填写知识库名称和描述进入编辑知识库页面(不填会自动生成),选择【导入文档】或是复制【链接】进行导入数据(下面以GraphRAG为例):

什么是RAG?什么是GraphRAG?一文带你读懂知识库机器人原理

导入成功后表明知识库已经建立完成,接下来就是要选择模型及刚刚新建的知识库,目前提供了国内外多种模型选择,可满足不同任务和领域的需求。

什么是RAG?什么是GraphRAG?一文带你读懂知识库机器人原理

知识库机器人创建成功后会直接跳转进入聊天界面,这样就可以向知识库机器人进行提问啦!

什么是RAG?什么是GraphRAG?一文带你读懂知识库机器人原理

希望通过本文对RAG和GraphRAG的解析,能让读者更好地理解知识库机器人背后的强大技术支撑。随着人工智能技术的不断进步,知识库机器人将在更多领域发挥巨大潜力,同时,我们也期待看到更多创新性的应用场景涌现,让知识库机器人更好地服务于人类社会,推动知识的传播与进步。

(0)
302.AI302.AI
上一篇 2024 年 9 月 10 日 下午6:47
下一篇 5天前

相关推荐

  • Coze正式开启付费计划!GPT-4白嫖时代结束?

    7月刚刚到来,Coze海外版就静悄悄开启付费计划,推出了Coze Premium Pricing Plans,得知这一消息的众多AI爱好者纷纷表示白嫖GPT-4的时代要结束了。 Coze是由字节跳动推出的AI聊天机器人构建平台,它允许用户快速创建、调试和优化AI聊天机器人的应用程序。这个平台特别适合对AI和机器人技术感兴趣的人,尤其是那些缺乏编程经验的用户。…

    2024 年 7 月 12 日
    17800
  • Glif生成的meme图瞎说什么大实话!如何免注册无次数限制使用?

    近日,在国外社交媒体平台上,一款叫做“Glif”的AI应用迅速蹿红,Glif有点类似国内的Coze,通过低代码或无代码的方式,并提供了非常多的工具作为节点,搭建工作流。 接下来先说一下Glif是什么,Glif是一个有趣的低代码平台,在基本层面上,Glif接受用户输入(文本、图像或点击按钮),并使用强大的AI模型生成输出(文本、图像、视频或这些的组合)。 概括…

    2024 年 7 月 17 日
    6300
  • Claude新功能?小白如何体验交互式写编程?

    Anthropic公司在今年3月发布了新模型Claude 3后,同样在今年的6月21日又再次官宣上新Claude 3.5 Sonnet模型,这中间仅仅隔了三个月左右的时间! 但是就今天的主角并不是Claude 3.5 Sonnet,而是与Claude 3.5 Sonnet一同官宣推出的新功能——Artifacts。 Anthropic PBC,是一家美国的人…

    2024 年 7 月 12 日
    6800
  • 可灵AI全面开放,引领视频创作新时代

    7月下旬,可灵AI(Kling AI)宣布全面开放,曾经在国内外内测名额“一号难求”的可灵成为了历史。可灵AI是由快手科技自研的视频生成大模型,能够根据文本提示生成长达2分钟、帧率为30fps的高质量视频,支持1080p分辨率,并支持多种宽高比,陆续升级推出了图生视频等功能。 从上线到全面开放,可灵历经了一个多月的时间: 6月10日,快手科技宣布推出了可灵大…

    2024 年 8 月 6 日
    6300
  • 视频生成模型神仙打架?到底哪家更胜一筹

    自从OpenAI发布了正在研发和测试中的文生视频大模型Sora后,AI视频生成工具接连“内卷”,开始”神仙打架“模式。 首先,在当地时间6月12日,Luma创始人官宣并发布新视频模型——Dream Machine。Dream Machine可以在120秒内生成120帧的视频,具备流畅的运动、电影摄影和戏剧效果。6月28日,Luma宣布首尾帧制作加入Dream…

    2024 年 7 月 17 日
    13800

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注