解决‘BaichuanTokenizer‘ object has no attribute ‘sp_model‘，无需重装transformers和torch

解决‘BaichuanTokenizer‘ object has no attribute ‘sp_model‘，无需重装transformers和torch

news/2025/4/27 17:00:17/文章来源:https://blog.csdn.net/qq_35166730/article/details/134162624

如https://github.com/baichuan-inc/Baichuan2/issues/204
中所说：

修改下 tokenization_baichuan.py ，把 super() 修改到最后执行

        self.vocab_file = vocab_fileself.add_bos_token = add_bos_tokenself.add_eos_token = add_eos_tokenself.sp_model = spm.SentencePieceProcessor(**self.sp_model_kwargs)self.sp_model.Load(vocab_file)super().__init__(bos_token=bos_token,eos_token=eos_token,unk_token=unk_token,pad_token=pad_token,add_bos_token=add_bos_token,add_eos_token=add_eos_token,sp_model_kwargs=self.sp_model_kwargs,clean_up_tokenization_spaces=clean_up_tokenization_spaces,**kwargs,)# self.vocab_file = vocab_file# self.add_bos_token = add_bos_token# self.add_eos_token = add_eos_token# self.sp_model = spm.SentencePieceProcessor(**self.sp_model_kwargs)# self.sp_model.Load(vocab_file)

注意需要把模型文件download到本地后修改模型文件中的tokenization_baichuan.py

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/126468.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【AI数学】三维视觉中的四种坐标系

【AI数学】三维视觉中的四种坐标系

三维视觉中，需要掌握四种坐标系：世界坐标系、相机视角坐标系、NDC坐标系、屏幕坐标系。世界坐标系（World coordinate system） 物体或者场景在真实世界中的位置。相机视角坐标系（Camera view coordinate system&…

阅读更多...

13.1 linux命令行查看控制串口（uart)全攻略

13.1 linux命令行查看控制串口（uart)全攻略

linux命令行查看控制串口（uart)全攻略本文主要内容： 1 串口启动驱动打印 2 sys目录下的串口信息 3 proc目录下的串口信息 4 etc目录下的串口信息 5 dev目录下的串口信息 6 stty控制具体的串口 7 命令行控制串口读写 8 串口数据解析 1 串口启动信息 root@am62xx-evm:~# dme…

阅读更多...

springboot的spring.jackson.date-format失效解决

springboot的spring.jackson.date-format失效解决

看起来数据库的格式非常完美,但是数据库字段look_date 是 datetime类型,java里没有datetime类型,这样一来如果你不在后端做处理,那么模型属性Date来接收一定会出问题.我通过实验证明最后拿到的是一个时间戳. 第一解决时间格式问题 1.可以通过application.propertis配置文件中…

阅读更多...

Linux 环境下安装 Elasticsearch 7.13.2

Linux 环境下安装 Elasticsearch 7.13.2

Linux 环境下安装 Elasticsearch 7.13.2 前言镜像下载（国内镜像地址）解压安装包修改配置文件用 Es 自带Jdk 运行配置 Es 可被远程访问然后启动接着启动本地测试一下能不能连 Es 前言借公司的 centos 7 服务器，搭建一个 Es，正好熟…

阅读更多...

Pod 进阶

Pod 进阶

//资源限制当定义 Pod 时可以选择性地为每个容器设定所需要的资源数量。最常见的可设定资源是 CPU 和内存大小，以及其他类型的资源。当为 Pod 中的容器指定了 request 资源时，调度器就使用该信息来决定将 Pod 调度到哪个节点上。当还为容器指定了 li…

阅读更多...

基于图神经网络的联邦学习跨企业推荐

基于图神经网络的联邦学习跨企业推荐

Federated Learning-Based Cross-Enterprise Recommendation With Graph Neural Networks 论文试图解决什么问题该论文试图解决跨企业推荐系统中存在的数据共享和用户隐私保护的问题。在许多小型和中型企业中，由于资源有限，无法提供足够的数据来进行大…

阅读更多...

HarmonyOS开发：开源一个刷新加载组件

HarmonyOS开发：开源一个刷新加载组件

前言系统Api中提供了下拉刷新组件Refresh，使用起来也是非常的好用，但是风格和日常的开发，有着巨大的出入，效果如下： 显然上面的效果是很难满足我们实际的需求的，奈何也没有提供的属性可以更改，…

阅读更多...

JVM虚拟机：通过一个例子解释JVM中栈结构的使用

JVM虚拟机：通过一个例子解释JVM中栈结构的使用

代码代码解析 main方法执行，创建栈帧并压栈。 int d8，d为局部变量，是基础类型，它位于虚拟机栈的局部变量表中然后创建了一个TestDemo的对象，这个对象在堆中，并且这个对象的成员变量（day&am…

阅读更多...

Web渗透Java初学者文章汇总

Web渗透Java初学者文章汇总

Java框架可以变，基础不会变。 Java 是一门高级编程语言，由 Sun Microsystems（后来被 Oracle 收购）所开发，于 1995 年首次发布。Java 的设计目标是“一次编写，到处运行”（Write Once, Run Anywhere），也被称为 WORA。这意味着可以在不同的操作系统和硬件平台上运行同样…

阅读更多...

京东API获得JD商品详情 item_get-获得JD商品详情

京东API获得JD商品详情 item_get-获得JD商品详情

item_get-获得JD商品详情公共参数名称类型必须描述keyString是调用key（必须以GET方式拼接在URL中）获取key和secret接入secretString是调用密钥api_nameString是API接口名称（包括在请求地址中）[item_search,item_get,item_sear…

阅读更多...

mysql之基础语句

mysql之基础语句

数据库的列类型 int：整型用于定义整数类型的数据 float：单精度浮点4字节32位准确表示到小数点后六位 double：双精度浮点8字节64位 char：固定长度的字符类用于定义字符类型数据&…

阅读更多...

深入理解计算机系统CS213学习笔记

深入理解计算机系统CS213学习笔记

Lecture 01 1. 计算机表示数字 int 整数运算可能会出现错误，超过32位时会出现溢出。 float 浮点数不适用结合律，因为浮点数表示的精度有限。根其原因，是用有限的位数表示无限的数字空间。 2.利用分层的存储系统，使程序运行更…

阅读更多...

从用户角度出发，如何优化大数据可视化体验｜北京蓝蓝UI设计公司

从用户角度出发，如何优化大数据可视化体验｜北京蓝蓝UI设计公司

作者：蓝蓝设计-鹤鹤大数据已经成为人们探索世界的新工具。但是，对于普通用户而言，大数据往往比较抽象和难以理解，因此，大数据可视化作为一种非常有效的工具工具被广泛应用。然而，在实际应用中&#xff0c…

阅读更多...

【java学习—十一】泛型（1）

【java学习—十一】泛型（1）

文章目录 1. 为什么要有泛型Generic2. 泛型怎么用2.1. 泛型类2.2. 泛型接口2.3. 泛型方法 3. 泛型通配符3.1. 通配符3.2. 有限制的通配符 1. 为什么要有泛型Generic 泛型，JDK1.5新加入的，解决数据类型的安全性问题，其主要原理是在类声明时通过…

阅读更多...

前端react入门day02-React中的事件绑定与组件

前端react入门day02-React中的事件绑定与组件

(创作不易，感谢有你，你的支持，就是我前行的最大动力，如果看完对你有帮助，请留下您的足迹） 目录 React中的事件绑定 React 基础事件绑定使用事件对象参数传递自定义参数同时传递事件对象和自定义参…

阅读更多...

nvm安装步骤

nvm安装步骤

注意事项不要安装任何版本的node.js，有的话卸载干净！注意：要卸载干净了！ 安装步骤： nvm下载点击exe文件安装安装目录选择：D:\NVM 下一步创建nodejs文件放在D:\NVM 下，然后一直next到最后 …

阅读更多...

亿咖通·天穹Pro行泊一体智能驾驶计算平台正式量产

亿咖通·天穹Pro行泊一体智能驾驶计算平台正式量产

全球出行科技公司亿咖通科技宣布，旗下首款智能驾驶计算平台——亿咖通•天穹Pro行泊一体智能驾驶计算平台（以下简称“该平台”）已向车企正式量产交付。作为亿咖通科技在智能驾驶领域的全新突破，亿咖通•天穹Pro智能驾驶计算平台以…

阅读更多...

柯桥专升本学校，自考本科文凭的价值如何？

柯桥专升本学校，自考本科文凭的价值如何？

自考本科文凭的价值如何？ 自考本科学历是通过独立学习和考试获得的一种本科学历。对于自考本科学历的价值，很多人感到困惑，那么究竟自考本科学历有多大的价值呢? 首先，在就业市场上，自考本科学历具有一定的竞争力。随…

阅读更多...

WPF RelativeSource属性-目标对象类型易错

WPF RelativeSource属性-目标对象类型易错

上一篇转载了RelativeSource的三种用法，其中第二种用法较常见，这里记录一下项目中曾经发生错误的地方，以防自己哪天忘记了，又犯了同样错误—WPF RelativeSource属性-CSDN博客先回顾一下： 控件关联其父级容器的属性—…

阅读更多...

iOS实现弹簧放大动画

iOS实现弹簧放大动画

效果图实现代码 - (void)setUpContraints {CGFloat topImageCentery (SCREEN_HEIGHT - 370 * PLUS_SCALE) / 2;[self.topIconView mas_makeConstraints:^(MASConstraintMaker *make) {make.centerX.mas_equalTo(0);make.centerY.equalTo(self.view.mas_top).with.offset(t…

阅读更多...

最新文章