目录
- Introduction
- LLM的限制
- 扩展理解:什么是机器学习
- 扩展阅读:机器学习的流程
- LangChain
Introduction
LLM的限制
大型语言模型,比如ChatGpt4,尽管已经非常强大,但是仍然存在一些限制:
- 知识更新:LLM的知识是基于训练数据的,者意味着,一旦训练完毕,模型的知识就固定下来不能再进行更新。
- 理解深度:虽然LLM可以生成准确的、上下文相关的文本,但它们并不能理解这些文本的深层含义,知识基于它们在大量文本数据上的训练来模仿人类的语言。
- 事实准确性:LLM可能会生成一些事实上不准确的信息,因为它们的目标是预测下一个词是什么,而不是确保生成的所有信息都是准确的。
- 偏见和公平性问题:LLM可能会反映出其训练数据中的偏见。
例如,某红书📕的模型可以归纳总结一些旅游、美食攻略,但有时候由于某些用户的思想特殊性也会出现一些*拳言论,微博同理。X中文区的数据则更离谱,容易出现一些触犯“底线”的言论。 - 生成恶意内容的风险:LLM可以被用来生成深度伪造内容(如windows激活码)或者恶意信息(如钓鱼邮件),从而被用于网络攻击、欺诈或者误导信息的传播。
扩展理解:什么是机器学习
举一个小例子,我以前特别喜欢玩一款叫作《梦幻西游》的游戏。弃坑之后,游戏方的客服经理总给我打电话,说 “Y哥能不能回来接着玩耍(充值)呀,帮派的小伙伴都十分想念你……”。这时候我就想:他们为什么会给我打电话呢?这款游戏每天都有用户流失,不可能给每个用户都打电话吧,那么肯定是挑重点用户来沟通了。 其后台肯定有玩家的各种数据,例如游戏时长、充值金额、战斗力等,通过这些数据就可以建立一个模型, 用来预测哪些用户最有可能返回来接着玩(充钱)!
机器学习要做的就是在数据中学习有价值的信息,例如先给计算机一堆数据,告诉它这些玩家都是重点客户,让计算机去学习一下这些重点客户的特点,以便之后在海量数据中能快速将它们识别出来。
机器学习能做的远不止这些,数据分析、图像识别、数据挖掘、自然语言处理、语音识别等都是以其为 基础的,也可以说人工智能的各种应用都需要机器学习来支撑。现在各大公司越来越注重数据的价值,人工成本也是越来越高,所以机器学习也就变得不可或缺了。(AI First —— Data First)
扩展阅读:机器学习的流程
假设我们从网络上收集了很多新闻,有的是体育类新闻,有的是非 体育类新闻,现在需要让机器准确地识别出新闻的类型。
一般来说,机器学习流程大致分为以下几步。
-
数据收集与预处理。例如,新闻中会掺杂很多特殊字符和广告等无关因素,要先把这些剔除掉。除此之外,可能还会用到对文章进行分词、提取关键词等操作。
-
特征工程,也叫作特征抽取。例如,有一段新闻,描述"科比(牢大)职业生涯画上圆满句号,今天正式退役了”。显然这是一篇与体育相关的新闻,但是计算机可不认识牢大,所以还需要将人能读懂的字符转换成计算机能识别的数值。这一步看起来容易,做起来就非常难了,如何构造合适的输入特征也是机器学习中非常重要的一部分。
-
模型构建。这一步只要训练一个分类器即可,当然,建模过程中还会涉及很多调参工作,随便建立一个差不多的模型很容易,但是想要将模型做得完美还需要大量的实验。
-
评估与预测。最后,模型构建完成就可以进行判断预测,一篇文章经过预处理再被传入模型中, 机器就会告诉我们按照它所学数据得出的是什么结果。
LangChain
综上所述,LangChain就是帮助我们引导、规范AI,完成一系列复杂的应用任务,以及通过工具整合来填补LLM各种缺陷的一个框架!!
比如,知识准确性不够就可以接入搜索引擎或新闻站点或知识百科以获取最新资讯;
比如,理解的深度不够,就提供一个思维链(Chain),一步一步引导AI完成整个思维过程的推导(Agent);