大模型学习与实践笔记(十一)

一、使用OpenCompass 对模型进行测评

1.环境安装:

git clone https://github.com/open-compass/opencompass
cd opencompass
pip install -e .

当github超时无法访问时,可以在原命令基础上加上地址: https://mirror.ghproxy.com

git clone https://mirror.ghproxy.com/https://github.com/open-compass/opencompass

2.数据准备

cp /share/temp/datasets/OpenCompassData-core-20231110.zip /root/opencompass/
unzip OpenCompassData-core-20231110.zip

3.查看支持的数据集和模型

python tools/list_configs.py internlm ceval # 列出所有跟 internlm 及 ceval 相关的配置

效果图:

4.启动测评

python run.py --datasets ceval_gen --hf-path /share/temp/model_repos/internlm-chat-7b/ --tokenizer-path /share/temp/model_repos/internlm-chat-7b/ --tokenizer-kwargs padding_side='left' truncation='left' trust_remote_code=True --model-kwargs trust_remote_code=True device_map='auto' --max-seq-len 2048 --max-out-len 16 --batch-size 4 --num-gpus 1 --debug

命令解析:

--datasets ceval_gen \
--hf-path /share/temp/model_repos/internlm-chat-7b/ \  # HuggingFace 模型路径
--tokenizer-path /share/temp/model_repos/internlm-chat-7b/ \  # HuggingFace tokenizer 路径(如果与模型路径相同,可以省略)
--tokenizer-kwargs padding_side='left' truncation='left' trust_remote_code=True \  # 构建 tokenizer 的参数
--model-kwargs device_map='auto' trust_remote_code=True \  # 构建模型的参数
--max-seq-len 2048 \  # 模型可以接受的最大序列长度
--max-out-len 16 \  # 生成的最大 token 数
--batch-size 4  \  # 批量大小
--num-gpus 1  # 运行模型所需的 GPU 数量
--debug

5.测评结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/639484.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络流量分析:揭秘网络世界的“魔法水晶球”

在数字化、信息化的时代,网络流量分析如同网络世界中的“X光机”,它使我们能够透视网络内部的数据流动,进而理解、优化并保障网络的健康运行。那么,究竟什么是网络流量分析?它有什么作用?又为何不可或缺&am…

司铭宇老师:房地产中介销售培训课程:如何打消购房者买房疑虑

房地产中介销售培训课程:如何打消购房者买房疑虑 购房是一项重大的人生决定,它不仅涉及到巨大的经济投入,还关系到购房者未来的生活品质。因此,购房者在做出购买决定前往往会有许多疑虑和担忧。作为房地产销售人员,能够…

VS2022联合Qt5开发学习9(QT5.12.3鼠标按下、释放、移动事件以及Qt上取标注点)

在研究医学图像可视化的时候,鼠标响应这里一直都有问题。研究了几天VTK的取点,还是会和Qt冲突。所以现在试试Qt的方式取点,看看能不能实现我的功能。 查了很多资料,这篇博文里的实例有部分参考了祥知道-CSDN博客这位博主的博客[Q…

函数组件useState用法 以及 useState异步回调获取不到最新值

目录 1、useState用法: 三个参数用法 2、如何监听state的变化 3、dispatch更新特点 4、解决上述demo中使用useState 异步回调获取不到最新值 4.1 下面这种情况的写法,仍获取不到最新值: 4.2 解决方案1:dispatch参数,作为函数…

超级菜鸟怎么学习数据分析?

如果你有python入门基础,在考虑数据分析岗,这篇文章将带你了解:数据分析人才的薪资水平,数据人应该掌握的技术栈。 首先来看看,我在搜索数据分析招聘时,各大厂开出的薪资: 那各大厂在数据领域…

DC电源模块的特点及应用案例分享

BOSHIDA DC电源模块的特点及应用案例分享 DC电源模块是一种可以将交流电转换为直流电的设备,具有以下特点: 1.高效稳定:DC电源模块采用高效稳定的电源转换技术,可以将输入的交流电转换为输出的稳定直流电,并且具有高…

什么是游戏盾?哪家效果好。

游戏盾是什么呢,很多做游戏开发的客户估计都是听说过的,但是也不是所有的游戏开发者会运用到。因为,游戏盾是针对游戏行业APP业务所推出的高度可定制的网络安全管理解决方案,除了能针对大型DDoS攻击(T级别)进行有效防御外&#xf…

动态规划学习——机器人运动

//一共有N个位置,机器人从start开始,走K步到end //机器人到1后只能向2运动,到N后只能向N-1运动,即不能越界,只能在1-N的位置运动 //求总的路线的个数 //例: //N4,startp1,endp3,K4 //则路线如下&#xff1a…

Leetcode的AC指南 —— 栈与队列:232.用栈实现队列

摘要: **Leetcode的AC指南 —— 栈与队列:232.用栈实现队列 **。题目介绍:请你仅使用两个栈实现先入先出队列。队列应当支持一般队列支持的所有操作(push、pop、peek、empty): 实现 MyQueue 类:…

列表列添加千分位保留两位小数

// 千分位无小数部分 function setThousandsMarkNoDecimal(num) {// console.log(num????, num, typeof num)if (!num) return num;let fu false;if (num.toString().includes(-)) {fu true;num Number(num.toString().substr(1));}// num Math.trunc(num); // 保留整数…

【Spring 篇】MyBatis注解开发:编写你的数据乐章

欢迎来到MyBatis的音乐殿堂!在这个充满节奏和韵律的舞台上,注解是我们编写数据乐章的得力助手。无需繁琐的XML配置,通过简单而强大的注解,你将能够轻松地与数据库交互。在这篇博客中,我们将深入探讨MyBatis注解开发的精…

华为OD机试 - 智能驾驶(Java JS Python C)

题目描述 有一辆汽车需要从 m * n 的地图左上角(起点)开往地图的右下角(终点),去往每一个地区都需要消耗一定的油量,加油站可进行加油。 请你计算汽车确保从从起点到达终点时所需的最少初始油量。 说明: 智能汽车可以上下左右四个方向移动地图上的数字取值是 0 或 -1 …

NLP自然语言处理实战

一、自然语言处理的概念 1.1 自然语言处理的起源 语言是人类社会发展过程的产物,是最能体现人类智慧和文明的证明,也是人类与动物最大的区别。它是一种人与人交流的载体,像计算机网络一样,我们使用语言相互传递知识。在人类历史…

潜水泵如何实现远程状态监测与预测性维护?

在各行各业,潜水泵的健康数据采集一直是一项具有挑战性的任务。然而,一项被称为电气特征分析(ESA)的技术通过在电机控制柜而非泵本身上安装传感器,成功解决了这一问题。 图.泵(iStock) 一、电气…

Docker部署Golang服务

不管是开发还是生产环境,通过 docker 方式部署服务都是一种不错的选择,能够解决不同开发环境一致性的问题。 本文以项目:https://github.com/johncxf/go_practice 为例。 Dockerfile 构建 Go 运用环境 在项目根目录下添加 Dockerfile 文件…

Ubuntu重设root的密码

重设root的密码 未重设密码之前,Ubuntu 中默认的 root 密码是随机的,即每次开机都会有一个新的root 密码,所以此时的 root 用户密码并不确定; 重设root 密码,使用安装时创建的用户登录后sudo su切换至root用户&#…

云服务器搭建coturn出现Not reachable?

文章目录 问题复现解决方案1. 云服务器端口开放问题2. 检查配置文件3. 浏览器 问题解决 问题复现 使用云服务器搭建coturn服务时,出现not reachable报错 ICE Server配置是正确的 但测试relay时却报错:not reachable? 并且服务器也没输出相应日志。 …

(2021|ICLR,扩散先验,VE-SDE,逼真和忠实的权衡)SDEdit:使用随机微分方程引导图像合成和编辑

SDEdit: Guided Image Synthesis and Editing with Stochastic Differential Equations 公和众和号:EDPJ(进 Q 交流群:922230617 或加 VX:CV_EDPJ 进 V 交流群) 目录 0. 摘要 2. 背景:使用随机微分方程…

vue3-生命周期

生命周期 生命周期 vue 组件实例都有自己的一个生命周期 从创建->初始化数据->编译模版->挂载实例到 DOM->数据变更后更新 DOM ->卸载组件 生命周期简单说就是 vue 实例从创建到销毁的过程 生命周期钩子 在各个周期运行时,会执行钩子函数&…

vue 函数化组件

Vue.js提供了一个functional的布尔值选项,设置为true可以使组件无状态和无实例,也就是没有data和this上下文。这样用render函数返回虚拟节点可以更容易渲染,因为函数化组件只是一个函数,渲染开销要小很多。 使用函数化组件时&…