大模型微调系列 --关于`transformer`中的`pipeline`是什么

大模型微调系列 --关于transformer中的pipeline是什么

  • pipeline就是一个帮你做数据预处理以及一些模型加载,模型预测的步骤的工具,提供各种接口

定义数据预处理函数

  • 对输入的文本进行预处理
    • 转换为小写
    • 去除标点符号
    • 去除特殊字符
def preprocess_text(text:str):text=text.lower()text=''.join([c for c in text if c.isalnum() or c.isspace()])  return text

模型加载的函数

  • 利用transformer库加载一个模型
from transformers import AutoModelForSequenceClassification,AutoTokenizer  
def load_model_tokenizer(model_name):tokenizer = AutoTokenizer.from_pretrained(model_name)model = AutoModelForSequenceClassification.from_pretrained(model_name)return tokenizer, model

模型的预测

  • 使用模型对预处理的文本进行预测
import torch 
def predict(text,model,tokenizer):text=preprocess_text(text)  inputs=tokenizer(text,return_tensors="pt")  outputs=model(**inputs)  _,predicted_class=torch.max(outputs.logits.softmax(dim=-1),dim=1)  return predicted_class  

组装

def self_pipe_line(text,model_name='./model/gpt2'):tokenizer,model=load_model_tokenizer(model_name)  return predict(text,model,tokenizer)  

使用的例子

text_to_classify="i am your father"  
predicted_class=self_pipe_line(text_to_classify)  
print(f"predict class: {predicted_class}")
Some weights of GPT2ForSequenceClassification were not initialized from the model checkpoint at ./model/gpt2 and are newly initialized: ['score.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.predict class: tensor([1])

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/17124.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JS 中怎么删除数组元素?有哪几种方法?

正文开始之前推荐一位宝藏博主免费分享的学习教程,学起来! 编号学习链接1Cesium: 保姆级教程+源码示例2openlayers: 保姆级教程+源码示例3Leaflet: 保姆级教程+源码示例4MapboxGL: 保姆级教程+源码示例splice() JavaScript中的splice()方法是一个内置的数组对象函数, 用于…

05.配置tomcat管理功能

认证失败&#xff0c;需要配置tomcat-users.xml文件 配置用户信息 [rootweb01 /application/tomcat/conf\]# tail tomcat-users.xml <role rolename"admin-gui"/> <role rolename"host-gui"/><role rolename"mana…

Java中集合中对象的某一个属性转为set集合

在Java中&#xff0c;如果你想要将一个集合&#xff08;比如List<YourObject>&#xff09;中对象的某个属性&#xff08;假设为String类型&#xff09;提取出来并放入一个Set<String>集合中&#xff0c;以确保去重&#xff0c;你可以通过Java 8的Stream API来轻松地…

Codeforces Round 946 (Div. 3)

Codeforces Round 946 &#xff08;div3&#xff09; A. Phone Desktop题意&#xff1a;题解&#xff1a;代码&#xff1a; Symmetric Encoding题意&#xff1a;题解&#xff1a;代码&#xff1a; C. Beautiful Triple Pairs题意&#xff1a;题解&#xff1a;代码&#xff1a;…

洛谷 CF1209D Cow and Snacks

题目来源于&#xff1a;洛谷 题目本质&#xff1a;并查集 解题思路&#xff1a; 我们以每种化为一个点&#xff0c;以每个客人喜欢的两朵花给两朵花连一条无向边。则会出现一定数目的连通块&#xff0c;连通块总个数为 ans。 对每个连通块进行分析&#xff1a;第一个客人买走…

QGraphicsView实现简易地图17『涟漪效果』

前文链接&#xff1a;QGraphicsView实现简易地图16『爆炸效果』 模仿水波荡漾时的涟漪效果&#xff0c;参考了echarts中的散点图 支持设置散点大小、颜色、涟漪线条宽度。 动态演示效果 静态展示图片 核心代码 #pragma once #include "../AbstractGeoItem.h" #incl…

452. 用最少数量的箭引爆气球(中等)

452. 用最少数量的箭引爆气球 1. 题目描述2.详细题解3.代码实现3.1 Python3.2 Java 1. 题目描述 题目中转&#xff1a;452. 用最少数量的箭引爆气球 2.详细题解 引爆所有气球&#xff0c;弓箭数要最少&#xff0c;那么每支弓箭尽量多的引爆气球&#xff0c;采用贪心策略。对于…

ThingsBoard网关在燃气泄漏监测中的应用

据不完全统计&#xff0c;全国城市燃气企业的供销差率大约在3%~4%&#xff0c;也就意味着越多的天然气销量就有越多的天然气损失。城市燃气企业计量管理已经接近最不利的状态&#xff0c;开展有效的计量管理势在必行。 智慧燃气综合管理系统 在燃气管网中部署智能传感器、数据采…

AI分析SP和pk进行sk分析

SP原始表行标题代表题目序号&#xff0c;列代表学生&#xff0c;如果学生答对题目为1&#xff0c;否则为0。问题知识点矩阵这个文件横轴代表每个知识点&#xff0c;列标题代表每个题目序号&#xff0c;如果题目包含这个知识点则该处值为1。通过两个文件判断学生对于每个知识点的…

微服务架构中服务间通信的最佳实践是什么?

在微服务架构中&#xff0c;服务间通信的最佳实践通常是使用轻量级的通信机制&#xff0c;如HTTP或RPC。以下是一些关键的最佳实践&#xff1a; 使用RESTful API或类似的设计风格&#xff1a;RESTful API基于标准的HTTP方法和状态码&#xff0c;使得服务之间的通信更加简单和可…

【一站式学会Kotlin】第十一节:非空断言操作符!!

作者介绍: 百度资深Android工程师T6,在百度任职7年半。 目前:成立赵小灰代码工作室,欢迎大家找我交流Android、微信小程序、鸿蒙项目。= 一:通俗易懂的人工智能教程:https://www.captainbed.cn/nefu/ 点一下,打开新世界的大门。 二:【一站式学会Kotlin】免费领取:作者…

规格说明(Specifications)

1.为什么需要规格说明&#xff1f; &#xff08;1&#xff09;许多程序中的严重错误是由于代码之间接口的行为误解引起的。虽然每个程序员心中都有规格说明&#xff0c;但并非所有程序员都将其写下来。这导致团队中的不同程序员对同一个接口有不同的理解。 &#xff08;2&#…

Web安全:文件上传漏洞详解,文件上传漏洞原理、绕过方式和防御方案。

「作者简介」&#xff1a;2022年北京冬奥会网络安全中国代表队&#xff0c;CSDN Top100&#xff0c;就职奇安信多年&#xff0c;以实战工作为基础对安全知识体系进行总结与归纳&#xff0c;著作适用于快速入门的 《网络安全自学教程》&#xff0c;内容涵盖系统安全、信息收集等…

Java实现链表

链表 前言一、链表的概念及结构二、链表的分类三、链表的实现无头单向非循环链表实现无头双向链表实现具体代码 四、链表习题五、顺序表和链表的区别 前言 推荐一个网站给想要了解或者学习人工智能知识的读者&#xff0c;这个网站里内容讲解通俗易懂且风趣幽默&#xff0c;对我…

51单片机-实机演示(单多个数码管)

仿真链接&#xff1a; http://t.csdnimg.cn/QAPhx 目录 一.引脚位置 二.多个显示 三 扩展 一.引脚位置 注意P00 - >A ; 这个多个的在左边,右边的A到B是控制最右边那个单个的. 接下来上显示单个的代码 #include <reg52.h> #include <intrins.h> #define u…

大字体学生出勤记录系统网页HTML源码

源码介绍 上课需要一个个点名记录出勤情况&#xff0c;就借助AI制作了一个网页版学生出勤记录系统&#xff0c; 大字体显示学生姓名和照片&#xff0c;让坐在最后排学生也能看清楚&#xff0c;显示姓名同时会语音播报姓名&#xff0c; 操作很简单&#xff0c;先导入学生姓名…

嵌入式学习 (Day:27 IPC --- 进程间通信)

IPC 进程间通信 interprocess communicate &#xff08;即&#xff1a;进程间进行数据交换&#xff09; 三大类&#xff1a; 进程间通信的方式&#xff08;共8种&#xff09; 1、古老的通信方式&#xff08;Linux设计时就有的&#xff09; 无名管道 有名…

用源码建站可能涉及知产侵权,建站的注意!

近日普推知产老杨看到央视报道一家公司用了某建站源码涉及知产侵权&#xff0c;起诉了全国八千多家公司&#xff0c;某梦自从创始人因病转给某公司后&#xff0c;也在大量起诉用其建站代码公司侵权&#xff0c;他们也都是申请了相关的著作权。 有的中小企业在运营中会涉及建站…

c++ 将指针转换为 void* 后,转换为怎么判断原指针类型?

当将指针转换为void后&#xff0c;擦除了指针所指向对象的类型信息&#xff0c;因此无法通过void指针来判断原始指针的类型。我这里有一套编程入门教程&#xff0c;不仅包含了详细的视频讲解&#xff0c;项目实战。如果你渴望学习编程&#xff0c;不妨点个关注&#xff0c;给个…

【面试题】JavaScript基础高频面试(下)

10、Javascript 闭包是什么,闭包形成的原因和闭包的用途 &#xff1f; 闭包&#xff08;Closure&#xff09;是 JavaScript 中的一个非常重要的概念。简单地说&#xff0c;闭包就是一个函数能够访问另一个函数的作用域。这是因为在 JavaScript 中&#xff0c;函数是一等公民&a…