LLM记录1

LLM的知识库问答有3种实现路径：RAG 或微调，或两者结合。
- RAG：低成本易部署，适用于知识会更新的场景，但知识内容多的情况下，检索成本会变高。
- 微调：算力成本高，微调效果不稳定，训练不好容易出现幻觉，不适用于知识频繁更新场景，但调好后，LLM回复速度很可观。
一种只适合采用外挂知识库而不适合采用微调方式的情况

对于已有的结构化数据，一定不要将其直接训练到大模型当中。

结构化数据，其实是已经进行了精确标注的数据，无论是数据的准确性、可解释性，都是大模型中的token所无法企及的，如果将这些结构化数据训练到大模型当中，极大可能会失去数据的各种标注属性，或者会弱化数据及其标注属性的强关联。

大语言模型的基础是机器学习，属于归纳法，要从海量的数据中发现规律，结果的可靠性、可解释性是它正在努力解决的问题，那么对于已经解决了这些问题的结构化的数据，如果重新混入大模型当中，则被认为是一种倒退，是损失。
在基于大模型的整体应用架构中，大模型的作用到底应该如何定位？

从目前来看，大模型所起到的作用主要体现在两方面，一是推理能力，二是知识库。

按照大力出奇迹的思路，知识库越大，也就是模型参数规模越大，推理能力越强，当然成本也就越高。

是否存在另外一种选择，例如大语言模型，就发挥它的“词语接龙”的语言能力，用于对指令的理解意图和生成自然语言式的结果，而其中关键的内在专业逻辑或事实，则由外部知识库来提供，不要由大语言模型来“推理”，这样就将纯专业知识交给外挂知识库来管理，大语言模型则重点提升语言相关的能力，不断增强特定的话术和表达方式。概括一句话就是，大语言模型负责语言逻辑，外挂知识库负责领域中的专业逻辑。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/792767.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

LLM记录1

相关文章

全量知识系统程序详细设计之 “起点”（递归原始版本）

【Docker笔记05】【网络模式】

靠谱的wordpress建站公司怎么选建网站避坑指南

通用开发技能系列：Authentication、OAuth、JWT 认证策略

Vaadin框架是如何处理前后端交互的？列举几个Vaadin中常用的UI组件，并描述它们的作用。如何使用Vaadin的布局管理器来构建复杂的用户界面？

基于隐私保护的可追踪可撤销密文策略属性加密方案论文阅读

算法训练营30天|LeetCode 332.重新安排行程 51.N皇后 37.解数独

基于springboot实现教师人事档案管理系统项目【项目源码+论文说明】计算机毕业设计

第六期丨酷雷曼无人机技能培训

阿里云服务器安装Java开发环境最佳实践

ABAP开发中常用弹窗的应用详解

【JS】打乱数组顺序，用作领域：随机播放音乐

中国智慧城管哪家做的好？

中颖51芯片学习1. 系统时钟及IO口输出操作

安全测试重点思考(中)--如何防止漏洞XSS和CSRF漏洞

day18-分发糖果

4.2总结

深入浅出 -- 系统架构之微服务架构常见的六种设计模式

DLC原理解析及其优化思考

国产数据库Oracle兼容性测试（一）