什么是RAG,RAG的意思就是,如果一套生成式AIGC大模型,你昨天训练了以后,那么今天的知识,还没有给他进行训练,那么回答的时候,他就会遗漏今天的知识,那么我们就可以通过检索的手段,把今天的知识,检索出来,然后补充道prompt中,给这个大模型.让他参考,这样就包含了今天的知识相当于实时了就.
会说到向量检索,位向量检索,设计的数据库,然后实现RAG系统.
RAG就是增强AIGC的检索能力,通过检索你的私域知识,以及实时的知识内容,生成向量数据库,然后,用prompt的方法把向量补充道prompt中,然后提供给生成式大模型,然后增强生成模型的能力,并且使得它更适用于自己的业务.
先来看一下效果,可以看到,这里
通过左侧,可以上传pdf文件,上传以后,我们再向大模型提问的时候,可以看到
他就会参考我们上传的pdf文件中的内容去回答了,很方便,而且不用微调和训练.通过RAG可以让AIGC具备原来不具备的知识.
可以看到RAG的过程是,当我们