使用transformers过程中出现的bug

1. The following model_kwargs are not used by the model: ['encoder_hidden_states', 'encoder_attention_mask'] (note: typos in the generate arguments will also show up in this list)

使用text_decoder就出现上述错误,这是由于transformers版本不兼容导致的

from transformers import AutoModel, AutoConfig, BertGenerationDecoder
decoder_config = AutoConfig.from_pretrained(args['text_checkpoint'])text_decoder = BertGenerationDecoder(config=decoder_config)output = self.text_decoder.generate(input_ids=cls_input_ids, encoder_hidden_states=encoder_hidden_states, encoder_attention_mask=encoder_attention_mask,  max_length=self.args['max_seq_length'], do_sample=True, num_beams=self.args['beam_size'], length_penalty=1.0, use_cache=True,)

解决办法:将transformer的版本换到以下范围, 4.15.0<=transformers<4.22.0,transformers>=4.25.0

比如:pip install transformers==4.25.1 or pip install transformers==4.20.1

2. No module named 'transformers.generation_beam_constraints' (其中transformers==4.28.1)

(1)解决办法

将:from transformers import generation_beam_constraints

改为:from transformers.generation import beam_constraints

(2)其他例子

有问题的代码:

# 可以在transformers == 4.23.1版本上面运行
from transformers.generation_beam_constraints import Constraint
from transformers.generation_beam_search import BeamScorer, BeamSearchScorer
from transformers.generation_logits_process import (EncoderNoRepeatNGramLogitsProcessor,ForcedBOSTokenLogitsProcessor,ForcedEOSTokenLogitsProcessor,HammingDiversityLogitsProcessor,InfNanRemoveLogitsProcessor,LogitsProcessorList,MinLengthLogitsProcessor,NoBadWordsLogitsProcessor,NoRepeatNGramLogitsProcessor,PrefixConstrainedLogitsProcessor,RepetitionPenaltyLogitsProcessor,TemperatureLogitsWarper,TopKLogitsWarper,TopPLogitsWarper,)
from transformers.generation_stopping_criteria import (MaxLengthCriteria,MaxTimeCriteria,StoppingCriteria,StoppingCriteriaList,validate_stopping_criteria,
)

修正后的代码:

# 可以在transformers == 4.28.1版本上面运行
from transformers.generation.beam_constraints import Constraint
from transformers.generation.beam_search import BeamScorer, BeamSearchScorer
from transformers.generation.logits_process import (EncoderNoRepeatNGramLogitsProcessor,ForcedBOSTokenLogitsProcessor,ForcedEOSTokenLogitsProcessor,HammingDiversityLogitsProcessor,InfNanRemoveLogitsProcessor,LogitsProcessorList,MinLengthLogitsProcessor,NoBadWordsLogitsProcessor,NoRepeatNGramLogitsProcessor,PrefixConstrainedLogitsProcessor,RepetitionPenaltyLogitsProcessor,TemperatureLogitsWarper,TopKLogitsWarper,TopPLogitsWarper,)
from transformers.generation.stopping_criteria import (MaxLengthCriteria,MaxTimeCriteria,StoppingCriteria,StoppingCriteriaList,validate_stopping_criteria,
)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/110042.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Chrome 115之后的版本,安装和使用chromedriver

在Python中使用selenium 时报如下错误&#xff1a; 1. 老版本chrome对应的chromedriver 下载地址&#xff1a;CNPM Binaries Mirror 2. 新版本chrome对应的chromedriver 下载地址&#xff1a;Chrome for Testing availability

sd卡的坏块管理与负载均衡

坏块管理 坏块是指在存储介质中出现物理损坏或不可靠的数据块。由于SD卡使用的是闪存技术&#xff0c;它也面临着坏块的问题。 SD卡通过实现坏块管理机制来处理坏块。具体的坏块管理方法可能因制造商和产品型号而有所不同&#xff0c;但通常会采取以下策略&#xff1a; 坏块标…

Python 网络爬虫

爬虫原理 计算机一次Request请求和服务器端的Response回应&#xff0c;即实现了网络连接。 爬虫需要做两件事&#xff1a;模拟计算机对服务器发起Request请求。 接受服务器的Response内容并解析、提取所需的信息。 多页面爬虫流程 ​​​​​​​多页面网页爬虫流程

设计模式的学习顺序

设计模式的学习顺序可以按照以下步骤进行&#xff1a; 掌握基础知识&#xff1a;先确保你对编程语言和软件开发的基本概念有深入的理解&#xff0c;包括面向对象编程、继承、多态等。学习常用设计模式&#xff1a;首先学习并理解一些常用的设计模式&#xff0c;例如单例模式、…

(Python) Python语音处理工具包AudioSegment的基本使用

1. AudioSegment库的使用 from pydub import AudioSegment # 可以看到读取文件有很多方式 # 有直接from_file(),也有from_mp3()、from_wav() # 下面的两个读取语句是等价的&#xff1a; soundAudioSegment.from_file("aaa.mp3","mp3") soundAudioSegment…

PLC 学习day02 硬件输入/输入的知识

1.资料来源 1.链接&#xff1a;三菱PLC视频教程全集之FX3U基本单元输入接线_哔哩哔哩_bilibili 2. 链接&#xff1a; 三菱plc视频教程全集之FX3U基本单元输出接线_哔哩哔哩_bilibili 2. PLC 的输入部分器件连接。 2.1 PLC输入部分的硬件知识 1. 一般输入部分是PLC获取信息的地…

WhatsApp 私域营销指南

当涉及到WhatsApp私域营销时&#xff0c;企业正逐渐意识到这个强大工具的潜力&#xff0c;为建立与用户之间更紧密的关系、提供个性化的服务和推广&#xff0c;以及增加用户忠诚度&#xff0c; WhatsApp已成为一个不可或缺的营销渠道。在如今竞争激烈的市场中&#xff0c;私域营…

基于SSM的仓库管理系统设计与实现

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;采用JSP技术开发 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#x…

【SpringCloud微服务项目实战-mall4cloud项目(4)】——mall4cloud-rbac

mall4cloud-rbac角色权限访问控制模块 系统架构与模块介绍系统架构rbac模型介绍 相关代码权限校验接口代码 补充 代码地址 github地址 fork自github原始项目 gitee地址 fork自gitee原始项目 系统架构与模块介绍 系统架构 从图中可以看到&#xff0c;微服务集群中&#xff0c;…

03 里氏替换原则

官方定义&#xff1a; 里氏替换原则&#xff08;Liskov Substitution Principle&#xff0c;LSP&#xff09;是由麻省理工学院计算机科学系教授芭芭拉利斯科夫于 1987 年在“面向对象技术的高峰会议”&#xff08;OOPSLA&#xff09;上发表的一篇论文《数据抽象和层次》&#…

微信小程序自定义方法submitPwd(e){}传入的e有什么作用

在微信小程序中&#xff0c;自定义方法&#xff08;也称为事件处理函数&#xff09;的参数 e 表示事件对象&#xff0c;用于传递事件的相关信息&#xff0c;包括事件类型、事件目标、事件数据等。通过 e 参数&#xff0c;可以获取事件的详细信息&#xff0c;并对事件进行相应的…

『Linux升级路』基本指令

&#x1f525;博客主页&#xff1a;小王又困了 &#x1f4da;系列专栏&#xff1a;Linux &#x1f31f;人之为学&#xff0c;不日近则日退 ❤️感谢大家点赞&#x1f44d;收藏⭐评论✍️ 目录 一、认识操作系统 &#x1f4d2;1.1什么是操作系统 &#x1f4d2;1.2操作系统…

【RDMA】librdmacm库和连接建立过程

翻译&#xff1a;rdma_cm - RDMA通信管理器。 概述&#xff1a;rdma_cm是用于建立RDMA传输上的通信的管理器。 说明&#xff1a;RDMA CM是一个用于建立可靠连接和不可靠数据报数据传输的通信管理器。它为建立连接提供了一个RDMA传输中立的接口。该API基于套接字&#xff0c;但…

如何处理前端路由懒加载?

聚沙成塔每天进步一点点 ⭐ 专栏简介 前端入门之旅&#xff1a;探索Web开发的奇妙世界 欢迎来到前端入门之旅&#xff01;感兴趣的可以订阅本专栏哦&#xff01;这个专栏是为那些对Web开发感兴趣、刚刚踏入前端领域的朋友们量身打造的。无论你是完全的新手还是有一些基础的开发…

使用dd命令来构造测试文件

近期因工作需要&#xff0c;需要构造大小随机的一些文件&#xff0c;作为测试场景的输入。 在Linux平台下&#xff0c;使用dd命令&#xff0c;可以方便的构造出符合要求的文件。 比如生成4M的文件&#xff0c;同时使用随机数作为输入&#xff0c;命令样例如下&#xff1a; dd…

Pytorch,矩阵求和维度变化解析

二维可以想象成一张纸&#xff0c; 三维可以想象成多张纸叠在一块 四维可以想成多沓纸 求和时&#xff0c;如果没设定keepdimTrue,则会消去相加的那一维度&#xff0c;否则则将维度变为1 A torch.arange(20).reshape(5, 4) A,A.shape, A.sum()(tensor([[ 0, 1, 2, 3],[ 4,…

AWS SAP-C02教程5--基础中间件

在AWS中除了计算、存储、网络之外,还有一些组件非常重要,包括基础组件、消息队列组件、日志组件、编排组件等,接下来就通过分成几个不同类别(这个分类按照AWS的大概分类进行分类,并无统一标准,只是具备一定相同功能归类在一起方便记忆) 目录 1 消息中间件1.1 SQS1.1.1 …

XSS攻击(1), 测试XSS漏洞, 获取cookie

XSS漏洞, 测试XSS漏洞, 获取cookie 一, 概念: XSS(Cross-Site Scripting), 跨站攻击脚本, XSS漏洞发生在前端, 依赖于浏览器的解析引擎, 让前端执行攻击代码. XSS其实也算注入类的攻击, XSS代码注入需要有JavaScript编程基础. 二, 目的: XSS&#xff08;跨站脚本&#xff0…

js实现红包雨功能(canvas,react,ts),包括图片不规则旋转、大小、转速、掉落速度控制、屏幕最大红包数量控制等功能

介绍 本文功能由canvas实现红包雨功能&#xff08;index.tsx&#xff09;本文为react的ts版。如有其他版本需求可评论区观赏地址&#xff0c;需过墙 import React, { Component } from react; // import ./index.css; import moneyx from /assets/images/RedEnvelopeRain/bal…

Ubuntu - 安装 MySQL 8

以下是在 Ubuntu 上安装 MySQL 8 的完整步骤&#xff1a; 步骤 1&#xff1a;更新包列表 首先&#xff0c;打开终端并执行以下命令来确保包列表是最新的&#xff1a; sudo apt update 步骤 2&#xff1a;安装 MySQL 8 服务器 接下来&#xff0c;使用以下命令安装 MySQL 8 …