关于LLM的简单赘述
- 在线大模型
- 开源大模型
- GPT系列模型先进模型特性
- 大模型未来发展最重要的两个趋势
在线大模型
以 OpenAIGPT
系列为代表的大模型,只提供在线调用方法,无本地硬件要求,但调用需要“按量计费”(以及有网络限制)。
- GPT模型
- 谷歌Gemini模型
- 国内的百度文心一言(未对普通开发者提供API);
开源大模型
以 LAMMA1、2模型
为代表的大模型,开源全部代码,可以直接 本地安装部署
,有一定硬件要求和开发技术门槛。
目前通用的开源模型包括LAMMA及其衍生模型:
- Mistral-8x7B-MOE(混合专家模型)
- 国内清华智谱ChatGLM系列模型
- 阿里通义于问Qwen模型
GPT系列模型先进模型特性
- 目前
最为领先的综合推理性能和Agent性能
,目前未逢敌手; 多角色对话系统
: 可以灵活设置对话角色,包括系统消息、用户消息、模型消息以及外部函数(Function calling)消息等;目前ChatGLM3已集成该功能
;Function calling :
打通大模型和外部工具调用之间的最关键功能,目前ChatGLM3和Gemini模型已集成该功能;
大模型未来发展最重要的两个趋势
- 其一:
更低门槛、更高效率的Agent开发框架
,将会将开发者普遍需求转化为开发框架自带的功能
- 连接外部工具需求:Function caling功能是其成为模型基本功能
- 构建本地知识库需求:借助Assistant APl三行代码即可实现
- 其二:
横跨语音、文字、图片、视频
的多模态大模型将成为大模型技术竞争的下一个战场