ChatGLM系列是国产大语言模型中性能最好、回答准确率最高的大模型。如果有毕业论文、课题研究的需要,可以关注一下这个大模型。
清华大学和智谱AI的第一代ChatGLM-6B在2023年3月份推出,开源模型推出之后不久就获得了很多的关注和使用。3个月后的2023年6月份,ChatGLM2发布,再次引起了业界广泛的关注。ChatGLM Logo如图1-2所示。
时隔半年以后,2023年的10月27日,智谱AI再次发布第三代基础大语言模型ChatGLM3系列。本次发布的第三代模型共包含3个:基础大语言模型ChatGLM3-6B-Base、对话调优大语言模型ChatGLM3-6B和长文本对话大语言模型ChatGLM3-6B-32K。
ChatGLM的独特之处在于,它不仅仅是一个语言模型,更是一个具备深度思考能力的语言专家。它能够理解并解析复杂的语言结构,对语义的理解更加精准,从而在回答问题、解决问题时更具针对性。同时,ChatGLM还具备了出色的记忆能力,可以记住与它交流过的每一个细节,实现个性化的交流体验。在每一次交流中,它都能根据用户的喜好和需求,提供更加贴心、高效的服务。除此之外,ChatGLM3系列模型除了基本对话能力的提升外还有诸多支持:
- 更强的代码执行能力:即Code Interpreter。ChatGLM3的代码增强模块 Code Interpreter 根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务。
- 网络搜索增强WebGLM:接入搜索增强,能自动根据问题在互联网上查找相关资料,并在回答时提供相关参考文献或文章链接。
- 全新的 Agent 智能体能力:ChatGLM3 集成了自研的 AgentTuning 技术,AI Agent水平比第二代提升1000%。关于AgentTuning,可以参考网络文章:如何提高大语言模型作为Agent的能力?清华大学与智谱AI推出AgentTuning方案。Agent能力非常依赖规划和推理,从公布的结果看,ChatGLM3在GSM8K等数学逻辑推理方面的评测结果已经超过GPT-3.5,因此对于Agent的支持理论上应该非常棒。
- 多模态能力:官方宣称多模态理解能力的CogVLM,看图识语义,在10余个国际标准图文评测数据集上取得SOTA。
- 端侧推理:ChatGLM3 推出可手机部署的端测模型 ChatGLM3-1.5B 和 ChatGLM3-3B,支持在手机端的调用,速度可以达到20 tokens/s,一般成年人阅读的速度是每秒2~5个单词,完全足够。而且官方宣称自己的ChatGLM3-1.5B和ChatGLM3-3B与ChatGLM2-6B水平差不多(即第二代)。
ChatGLM系列是国产非常具有影响力的大语言模型系列,从2023年3月份开源第一代,到2023年7个月迭代到第三代,发展十分迅猛。而且,在AI Agent、代码执行、多模态等方面都有非常好的布局和提升,十分值得大家关注。
可以预见,ChatGLM不仅可以作为一个自然语言处理大模型,还可以广泛应用于其他的应用场景,例如教育辅导、智能客服、智能助手、智能写作等多个领域,为人们的生活带来极大的便利。
(1)在教育领域,ChatGLM发挥了重要的作用。它能够根据学生的提问和需求,提供精准、及时的解答。同时,ChatGLM还可以根据学生的学习情况和兴趣爱好,提供个性化的学习建议和资源推荐。这使得教育更加智能化、个性化,从而提高学生的学习效果和兴趣。
(2)在智能客服领域,ChatGLM以其高效、精准的回答能力,解决了传统客服面临的种种问题。它能够快速、准确地理解用户的问题和需求,提供有针对性的解决方案。这大大提高了客服效率和服务质量,提升了用户的满意度和忠诚度。
(3)在智能助手领域,ChatGLM可以帮助人们完成各种任务,如订餐、购物、日程管理等。通过自然语言交互,用户可以轻松地与助手进行交流,实现快速、便捷的生活体验。
(4)在智能写作领域,ChatGLM可以帮助人们快速生成文章、报告等文本内容。通过输入关键词或主题,用户可以轻松地获得高质量的文本内容,从而提高写作效率和准确性。
ChatGLM模型以其卓越的性能和广泛的应用,展现了人工智能领域的强大潜力和无限可能性。作为一款大语言模型,它不仅具备了深度思考能力、精准语义理解能力和个性化交流体验能力等多种优势,还广泛应用于智能客服、智能助手、教育辅导等多个领域。这使得ChatGLM成为人工智能领域中的一颗璀璨明珠,为人类社会带来了诸多便利和改变。
本文节选自《ChatGLM3大模型本地化部署、应用开发与微调》,获出版社和作者授权发布。