GLM-4-9B性能究竟如何?

GLM-4-9B 开源系列模型

前言

QQ截图20240605201737.png

自 2023 年 3 月 14 日 ChatGLM-6B 开源以来,GLM 系列模型受到广泛认可。特别是在 ChatGLM3-6B 开源后,针对让小模型能够拥有更为强大的能力这一目标,GLM 技术团队展开了诸多的探索性工作。历经将近半年的探索历程,他们成功推出了第四代 GLM 系列的开源模型,即 GLM-4-9B。

介绍GLM-4-9B

QQ截图20240605201931.png

GLM-4-9B在预训练时引入大语言模型进入数据筛选流程,获得 10T 高质量多语言数据,数据量超 ChatGLM3-6B 模型 3 倍多,且采用 FP8 技术高效预训练,训练效率比第三代模型提高 3.5 倍。考虑多数用户显存大小后,将模型规模提升至 9B,预训练计算量增加 5 倍。

综合各种技术升级和经验,GLM-4-9B 模型有更强推理性能、更长上下文处理能力、多语言、多模态和 All Tools 等突出能力。其系列包括基础版本 GLM-4-9B(8K)、对话版本 GLM-4-9B-Chat(128K)、超长上下文版本 GLM-4-9B-Chat-1M(1M)和多模态版本 GLM-4V-9B-Chat(8K)。

基于强大预训练基座,GLM-4-9B 的中英文综合性能比 ChatGLM3-6B 提升 40%,在一些方面如 AlignBench、IFeval、Natural Code Bench 等显著提升,对比 Llama 3 8B 模型也不逊色,中文学科方面提升达 50%。其上下文从 128K 扩展到 1M tokens,可处理约 200 万字输入。GLM-4-9B-Chat-1M 模型在 1M 上下文长度下进行“大海捞针”实验显示出出色无损处理能力。

多语言方面支持 26 种语言,还改进了 tokenizer 词表大小,编码效率提高 30%,在多语言测试中显著超越 Llama-3-8B-Instruct。Function Call 能力大幅升级,与 GPT-4 相当。All Tools 能力即能理解和使用一系列外部工具,GLM-4 模型已升级此能力,GLM-4-9B 也具备,且开源仓库有完整 All Tools Demo。

同时,还首次推出基于 GLM 基座的开源多模态模型 GLM-4V-9B,采用类似 CogVLM2 架构设计,能处理高分辨率输入,通过降采样减少 token 开销,未引入额外视觉专家模块,直接混合文本和图片数据训练,性能优势明显,在一些任务中与 GPT-4V 不相上下。

总结

​GLM 技术团队经近半年努力推出 GLM-4-9B 开源模型,它具有更强推理性能、更长上下文处理等突出能力和诸多特点,这也展示出了GLM团队在AI方面的成果。

如果你对算力感兴趣或有需求,可以来厚德云官方看看!厚德云是专业的AI算力云平台,为用户提供稳定、可靠、易用、省钱的GPU算力解决方案。海量GPU算力资源租用,就在厚德云。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/22893.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

风机5G智能制造工厂工业物联数字孪生平台,推进制造业数字化转型

风机5G智能制造工厂工业物联数字孪生平台,推进制造业数字化转型。在信息化、智能化的浪潮中,风机5G智能制造工厂工业物联数字孪生平台正以其独特的优势,推动制造业实现数字化转型。数字孪生平台不仅为风机制造业带来了前所未有的机遇&#xf…

计算机图形学入门06:视口变换

在前面的内容中,在MVP变换(模型变换,视图变换,投影变换)完后,所有的物体位置都变换到了[-1, 1]的标准立方体里,下一步要把物体绘制到屏幕(Screen)上。 1.什么是屏幕? 对于图形学来说把屏幕抽象的认为是一个…

mac Network: use --host to expose

本地启动无法访问,这个不是权限问题是mac 主机端口安全策略,现在我们只需要开启端口自动检测就可以 npm run dev --host 网络:未暴露 方案一 1、执行 npm run dev -- --host 方案二 1、请在 vite.config.js server: {host: true } 1…

给快高考的儿子的一封信:关于选择计算机专业

亲爱的儿子, 你好! 时间过得真快,转眼间你就要高考了,这不仅是你人生中的一个重要时刻,也是我们全家都非常关注的节点。妈妈告诉我,你对计算机专业很感兴趣,希望我能给你一些建议。我很高兴听…

使用手机小程序给证件照换底色

临时遇到一个需求,需要给证件照换底色。原始图像如下 最终需要换成红底的。 本次使用一款小程序"泰世茂证件照",打开该小程序,如下图所示 单击开始制作,然后选择二寸红底,如下图所示 然后单击相…

逗拍短视频:成都鼎茂宏升文化传媒公司

逗拍短视频:欢乐瞬间的创意呈现 在当下这个快节奏、信息化的时代,逗拍短视频以其独特的魅力,成为了人们生活中不可或缺的一部分。成都鼎茂宏升文化传媒公司它以其简短、有趣、富有创意的特点,迅速俘获了广大网友的心,…

Docker高级篇之安装Redis集群(分布式存储案例)

文章目录 1. 案例场景2. 3主3从redis集群扩缩容配置案例架构说明3. 3主3从redis集群扩缩容配置案例搭建4. 主从容错切换迁移案例5. 主从扩容6. 主从缩容 1. 案例场景 1~2亿条数据需要缓存,如何设计这个存储案例?这种情况下单机存储100%是不可…

社区待就业人员信息管理系统的设计

管理员账户功能包括:系统首页,个人中心,工作岗位管理,基础数据管理,预约面试管理,就业信息管理,公告信息管理 社区工作账户功能包括:系统首页,个人中心,用户…

做自媒体素材哪里找?做自媒体必备的几个高质量素材网站分享

在自媒体的世界里,内容是王道。无论是视频还是文章,优秀的自媒体作品都需要有力的内容和高质量的素材作支撑。今天,我为大家整理了一些优质的素材网站,帮助每一位自媒体创作者,无论新手还是老手,都能找到适…

文件夹如何加密码?这4个文件夹加密方法值得一试!

文件夹如何加密码?在与朋友、家人和同事共享同一电脑计算机时,您可能有一些不希望他们查看的重要或机密文件。那么如何避免这种情况呢?使用密码保护锁定文件和文件夹可以提高你的数字隐私和安全性,因为这意味着你需要输入密码才能…

每天CTF小练一点--ctfshow年CTF

初一 题目: 2023是兔年,密码也是。聪明的小伙伴们,你能破解出下面的密码吗? 感谢大菜鸡师傅出题 flag格式是ctfshow{xxxxxx}.或许密码也有密码。 密文是: U2FsdGVkX1M7duRffUvQgJlESPfOTV2i4TJpc9YybgZ9ONmPk/RJje …

修复Windows上“发生意外错误”问题的5种方法,总有一种适合你

在尝试启动网络适配器的设置菜单时,是否收到“发生意外错误”消息?不用担心,因为在大多数情况下解决这个问题很容易。我们将向你展示在Windows 11或Windows 10计算机上解决此问题的多种方法。 为什么我收到“发生意外错误”的消息 当网络适配器出现问题时,Windows会显示一…

老师评职称三证不一致怎么办

对于老师们来说,职称评定无疑是一个重要环节,不仅关系到教师的个人荣誉,更关系到职业发展和薪酬待遇。然而,当遇到教师资格证、任职资格证上的学科与实际所教学科不一致时,职称评定之路似乎变得崎岖不平。面对这样的困…

作业-day-240605

思维导图 C编程 设计一个Per类&#xff0c;类中包含私有成员:姓名、年龄、指针成员身高、体重 再设计一个Stu类&#xff0c;类中包含私有成员:成绩、Per类对象p1 设计这两个类的构造函数、析构函数。 #include <iostream>using namespace std;class Per{ private:str…

Science项目文章 | 中国农科院作科所研究团队解析“复粒稻”多粒簇生的机制

2024年3月8日&#xff0c;由中国农业科学院作物科学研究所童红宁研究员领衔的研究团队在Science发表题为“Enhancing rice panicle branching and grain yield through tissue-specific brassinosteroid inhibition”的研究论文。该研究报道了复粒稻多粒簇形成的机制&#xff0…

用单链表实现集合

一、实验题目 &#xff08;1&#xff09;实验题目 用单链表实现集合 &#xff08;2&#xff09;问题描述 用有序单链表实现集合的判等、交、并和差等基本运算。 二、实验内容 &#xff08;1&#xff09;采用有序单链表存储集合&#xff1b; &#xff08;2&#xff09;实现交…

实时监控与报警:人员跌倒检测算法的实践

在全球范围内&#xff0c;跌倒事件对老年人和儿童的健康与安全构成了重大威胁。据统计&#xff0c;跌倒是老年人意外伤害和死亡的主要原因之一。开发人员跌倒检测算法的目的是通过技术手段及时发现和响应跌倒事件&#xff0c;减少因延迟救助而造成的严重后果。这不仅对老年人群…

SpringBoot: 读取项目的Git版本号

在开发项目的时候&#xff0c;我们经常会想要拿到线上运行的程序版本&#xff0c;以确定程序是否正确发布。Spring Boot提供了这样的能力支持。这个能力的核心组件是3个: Maven插件git-commit-id-maven-plugin&#xff0c;用于生成.properties文件&#xff0c;里边包含git的各…

项目部署服务器--浏览器拒绝访问问题

一、检查自己的环境 是本地环境、还是虚拟环境 当您使用 Gunicorn 启动 Flask 应用并监听 0.0.0.0:5000 时&#xff0c;您的 Flask 应用已经可以在服务器上运行并通过该端口提供服务了。但是&#xff0c;0.0.0.0 是一个特殊的 IP 地址&#xff0c;它表示“所有可用的网络接口”…

Windows 包管理器 Chocolatey

1、前言 在Windows上做开发&#xff0c;经常会为频繁安装卸载软件而烦恼&#xff0c;着实有点羡慕Linux和macOS上强大的包管理系统。 今天就来解决这个问题。 什么是包管理器? 包管理器是一种自动安装、配置、升级和卸载软件包的工具。它可以解决手动安装软件的诸多痛点: &…