GLM4模型详解 - 智谱AI开源大模型全面解析

📚 2024年6月5日,智谱AI在开发者大会上正式开源GLM-4-9B系列大模型。本文将全面解析GLM4的技术特点、部署方案和应用场景。

GLM-4-9B 模型具备了更强大的推理性能、更长的上下文处理能力、多语言、多模态和 All Tools 等突出能力。

“All Tools”

一、模型概述

1. 基本信息

  • 发布机构: 智谱AI
  • 开源协议: Apache 2.0
  • 发布时间: 2024年6月5日
  • 开源版本: GLM-4-9B系列
  • 支持语言: 26种语言

2. 模型系列

  • GLM-4-9B: 基础版本(8K上下文)
  • GLM-4-9B-Chat: 对话版本(128K上下文)
  • GLM-4-9B-Chat-1M: 超长上下文版本(1M上下文)
  • GLM-4V-9B-Chat: 多模态版本(8K上下文)

二、技术特点

1. 核心优势

  • 超长上下文

    • 基础版本支持8K
    • Chat版本支持128K
    • 特制版本支持1M
  • 多语言能力

    • 支持26种语言
    • 中英文表现优异
    • 跨语言理解能力强
  • All Tools能力

    • 代码执行能力
    • 网页浏览能力
    • 画图能力
    • 文件操作
    • 数据库查询
    • API调用

2. 多模态特性

  • 图像处理能力
    • 支持1120x1120分辨率输入
    • 采用降采样减少token开销
    • 无额外视觉专家模块
    • 直接混合文本和图片训练

三、部署要求

1. 硬件需求

模型版本最小显存(FP16)推荐显存适用显卡
Base-9B18GB24GB3090/4090
Chat-9B20GB24GBA5000/4090
Chat-1M24GB32GBA5000/4090
V-9B24GB32GBA5000/4090

2. 软件环境

# 基础环境要求
Python >= 3.8
CUDA >= 11.7
PyTorch >= 2.0.0# 安装依赖
pip install modelscope
pip install transformers
pip install torch

四、部署方案

1. ModelScope部署

from modelscope import AutoModelForCausalLM, AutoTokenizer
from modelscope import snapshot_downloadmodel_dir = snapshot_download('ZhipuAI/glm4-9b')
model = AutoModelForCausalLM.from_pretrained(model_dir,trust_remote_code=True
).cuda()
tokenizer = AutoTokenizer.from_pretrained(model_dir,trust_remote_code=True
)

2. HuggingFace部署

from transformers import AutoModelForCausalLM, AutoTokenizermodel = AutoModelForCausalLM.from_pretrained("THUDM/glm4-9b",trust_remote_code=True
).cuda()
tokenizer = AutoTokenizer.from_pretrained("THUDM/glm4-9b",trust_remote_code=True
)

3. 推理示例

# 对话模式
response, history = model.chat(tokenizer,"你好,请介绍下你自己",history=[]
)# 多模态对话(GLM-4V)
from PIL import Image
image = Image.open("example.jpg")
response = model.chat(tokenizer,"描述这张图片",history=[],image=image
)

五、应用场景

1. 智能对话

  • 客服机器人
  • 个人助手
  • 教育辅导

2. 文档处理

  • 长文档理解
  • 文档摘要
  • 信息提取

3. 多模态应用

  • 图像理解
  • 图文创作
  • 视觉问答

4. 工具调用

  • 代码执行
  • 网页浏览
  • 数据分析

六、最佳实践

1. 提示工程

# 基础对话模板
messages = [{"role": "system", "content": "你是GLM4,一个AI助手"},{"role": "user", "content": "你的问题"},
]# 工具调用模板
messages = [{"role": "system", "content": "你可以使用代码解决问题"},{"role": "user", "content": "帮我写个Python函数"},
]

2. 性能优化

  • 使用半精度推理(FP16)
  • 启用批处理加速
  • 合理设置生成参数

相关资源

1. 官方资源

  • GitHub仓库
  • 模型下载-HF
  • 模型下载-MS

2. 文档教程

  • GLM4开发文档
  • ModelScope教程

总结

GLM4作为新一代开源大模型:

  1. 在超长上下文处理方面有突出优势
  2. 提供了丰富的工具调用能力
  3. 多模态能力设计优雅
  4. 部署要求相对合理

💡 使用建议:

  1. 新手建议从Chat版本开始
  2. 需要处理长文本选择1M版本
  3. 图像处理任务使用V版本
  4. 重视提示词设计优化效果

希望这篇文章能帮助你更好地了解和使用GLM4模型!如果觉得有帮助,请点赞支持~ 😊

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/64198.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

DataEase 开源 BI 工具 v2.10.3 LTS 发布

DataEase 开源 BI 工具 v2.10.3 LTS 发布 2024 年 12 月 9 日,开源 BI 工具 DataEase 正式发布 v2.10.3 LTS 版本。 此次更新带来了多方面的功能变化: 数据源:API 数据源与 Excel 数据源可设定字段类型与长度,优化数据接入的精准…

ionic V6 安装ios所需

npm install capacitor/ios添加ios平台 ruby要求3.0以上 rvm use ruby-3.1.0 --default npx cap add ios打开xcode看看创建的项目 npx cap open ios没有capacitor指定的位置, 估计之前pod(cocoapods)安装搞得Ruby环境很乱了......cocoapods整的我麻了... App/App/capacitor…

51单片机--- 串口控制仿真

51单片机--- 串口控制仿真 实验目标:51单片机接收串口数据,根据数据点亮LED。 实验步骤: 在Proteus里画出原理图 在Keil里用C语言编写程序 在Proteus中导入HEX文件,启动仿真 实验协议: 波特率115200 数据位:8位,停止位:1位,校验位:无。 命令格式: 一条命令为…

ssm-day04 mybatis

mybatis是一个持久层框架,针对的是JDBC的优化 简化数据库操作,能进行单表、多表操作,在这个框架下,需要我们自己写SQL语句 Mapper接口和MapperXML文件就相当于Dao和Dao层的实现 通常将xml文件放在resources包下 ,放在…

观测云亮相 Doris Summit,展示流式聚合创新技术

01 技术亮点:重新定义流式聚合的效率与体验 在演讲中,熊豹详细介绍了 GuanceDB 如何支撑观测云的全量业务场景,并分享了 SelectDB 在处理复杂查询中的应用与挑战。从动态表结构管理到函数下推优化,观测云通过灵活的架构设计有效解…

qt中tr的使用

在 Qt 中使用 tr 函数对字符串进行翻译时,通常会通过 Qt Linguist 工具来处理翻译。以下是一个基本的步骤说明,展示如何将 QPushButton *btnnew QPushButton(tr("Hello World"),this); 翻译成其他语言,比如中文: 1.创建…

因特网的发展三个阶段

因特网的发展大致分为哪几个阶段,这几个阶段的主要特点 第一个阶段——单个网络到互联网 1969年美国创建第一个分组交换的单个网络ARPANET(单个的分组交换网)所有要连接在ARPANET上的主机都直接与就近的节点交换机相连; 20世纪…

基于X410的LabVIEW FPGA跳频通信系统开发

跳频通信系统是一种高效的无线通信技术,通过在多个频率间快速切换,提高抗干扰能力和信号安全性。以NI USRP X410为硬件平台,利用LabVIEW FPGA实现一个实时跳频通信系统,涵盖信号生成、触发控制、接收检测及实时数据处理。 系统架构…

校园交友app/校园资源共享小程序/校园圈子集合二手物品交易论坛、交友等综合型生活服务社交论坛

多客校园社交圈子系统搭建 校园交友多功能系统源码: 1、更改学校为独立的模块。整体UI改为绿色,青春色,更贴近校园风格。2、圈子归纳到学校去进行运营。每个学校可建立多个圈子。和其他学校圈子互不干扰。3、增加用户绑定学校,以后进入将默认…

医院跌倒检测识别 使用YOLO,COCO ,VOC格式对4806张原始图片进行标注,可识别病人跌倒,病人的危险行为,病床等场景,预测准确率可达96.7%

医院跌倒检测识别 使用YOLO,COCO ,VOC格式对4806张原始图片进行标注,可识别病人跌倒,病人的危险行为,病床等场景,预测准确率可达96.7% 数据集分割 4806总图像数 训练组70% 3364图片 有效集20&#…

SQL进阶技巧:如何根据工业制程参数计算良品率?

目录 0 问题描述 1 数据准备 2 问题分析 步骤1:确定每个生产批次的制程参数是否在合格范围内 步骤2:基于中间结果一计算临时良品数量 步骤3:计算良品率(最终结果) 3 小结 问题拓展:如果制程参数是动…

RK3568平台(内存篇)内存管理架构

一.内存管理架构 内核管理内存的基本单位page页: 物理内存被分割成相同大小的组,内核用页来表示这个组,页是内核管理内存的基本单位,尽管处理器的最小可寻址单位通常是字, 但是, 内存管理单元MMU通常以页为单位进行处理. 因此,从虚拟内存的上来看,页就是最小单位. 页帧…

常见漏洞—ssti

我之前在做了几道题之后写了一篇只包含python环境的ssti的总结,后来刷portswigger lab的时候才发觉自己先入为主了,所以决定重新写一篇。 因本人技术浅薄,只对见过的几个模板做简单介绍,如果想看有深度的文章,可以直接…

WEB语义化的新探索:浅析LLMs.txt

【引】有人迷恋使用大模型生成各种有趣的内容, 有人沉醉于大模型相关技术的探索,没有对错,只在于你的乐趣所在。 一项名为 llms.txt 的新提案标志了一些非同寻常的东西的出现: 一个Web网站不仅为人类读者服务,而且为人工智能提供服…

MacOs使用Wine 安装UaExpert与UaExpert的使用

要在 macOS 上使用 Wine 安装和运行 UaExpert,可以按照以下步骤操作: 安装 Wine 在 macOS 上,你可以通过 Homebrew 来安装 Wine。如果你还没有安装 Homebrew,可以先安装 Homebrew,然后使用它来安装 Wine。 bash /bin…

scp命令

scp(Secure Copy Protocol)是一种用于在不同主机之间安全传输文件的命令。使用 scp 命令,你可以将文件从本地计算机复制到远程计算机,或者从远程计算机复制到本地计算机。 以下是 scp 命令的基本语法和一些示例: 基本…

YOLOv10改进,YOLOv10利用DLKAttention融合DCNv3、DCNv4形成全新的可变形大核注意力,并二次创新C2f结构,全网首发

理论介绍 完成本篇需要参考以下三篇文章,并已添加到YOLOv10代码中 YOLOv10改进,YOLOv10添加DCNv3可变性卷积与C2f结构融合(无需编译)YOLOv10改进,YOLOv10添加DCNv4可变性卷积(windows系统成功编译),全网最详细教程YOLOv10改进,YOLOv10添加DLKA-Attention可变形大核注意力…

信奥赛CSP-J复赛集训(bfs专题)(5):洛谷P3395:路障

信奥赛CSP-J复赛集训(bfs专题-刷题题单及题解)(5):洛谷P3395:路障 题目描述 B 君站在一个 n n n\times n n

使用PyTorch Lightning简化深度学习模型开发

使用PyTorch Lightning简化深度学习模型开发 引言 随着深度学习领域的快速发展,开发者们面临着越来越多的挑战。从构建高效的训练循环到管理复杂的超参数,这些任务不仅耗时而且容易出错。为了帮助开发者更专注于模型的设计与创新,而不是被琐…

SSM 技术驱动的垃圾分类系统,引领绿色风尚

第1章 概述 1.1 研究背景 随着现代网络技术发展,对于垃圾分类系统现在正处于网络发展的阶段,所以对它的要求也是比较严格的,要从这个系统的功能和用户实际需求来进行对系统制定开发的发展方式,依靠网络技术的的快速发展和现代通讯…