HuggingFace学习笔记--Model的使用

1--Model介绍

Transformer的 model 一般可以分为：编码器类型（自编码）、解码器类型（自回归）和编码器解码器类型（序列到序列）；

Model Head（任务头）是在base模型的基础上，根据不同任务而设置的模块；base模型只起到一个编码和建模特征的功能；

简单代码：

from transformers import AutoTokenizer, AutoModel, AutoModelForSequenceClassificationif __name__ == "__main__":# 数据处理sen = "弱小的我也有大梦想！"tokenizer = AutoTokenizer.from_pretrained("hfl/rbt3")inputs = tokenizer(sen, return_tensors="pt")# 不带model head的模型调用model = AutoModel.from_pretrained("hfl/rbt3", output_attentions=True)output1 = model(**inputs)print(output1.last_hidden_state.size()) # [1, 12, 768]# 带model head的模型调用clz_model = AutoModelForSequenceClassification.from_pretrained("hfl/rbt3", num_labels=10)output2 = clz_model(**inputs)print(output2.logits.shape) # [1, 10]

2--AutoModel的使用

官方文档

AutoModel 用于加载模型；

2-1--简单Demo

测试代码：

from transformers import AutoTokenizer, AutoModelif __name__ == "__main__":checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"tokenlizer = AutoTokenizer.from_pretrained(checkpoint) raw_input = ["I love kobe bryant.", "Me too."]inputs = tokenlizer(raw_input, padding = "longest", truncation = True, max_length = 512, return_tensors = "pt")# 加载指定的模型model = AutoModel.from_pretrained(checkpoint)print("model: \n", model)outputs = model(**inputs)print("last_hidden_state: \n", outputs.last_hidden_state.shape) # 打印最后一个隐层的输出维度# [2 7 768] batch_size为2，7个token，每个token的维度为768

输出结果：

last_hidden_state: torch.Size([2, 7, 768])# 最后一个隐层的输出
# batchsize为2，表示两个句子
# 7表示token数，每一个句子有7个token
# 768表示特征大小，每一个token的维度为768

测试代码：

from transformers import AutoTokenizer, AutoModelForSequenceClassificationif __name__ == "__main__":checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"tokenlizer = AutoTokenizer.from_pretrained(checkpoint) raw_input = ["I love kobe bryant.", "Me too."]inputs = tokenlizer(raw_input, padding = "longest", truncation = True, max_length = 512, return_tensors = "pt")model2 = AutoModelForSequenceClassification.from_pretrained(checkpoint) # 二分类任务print(model2)outputs2 = model2(**inputs)print(outputs2.logits.shape)

运行结果：

torch.Size([2, 2])
# 两个句子，每个句子二分类的概率

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/186679.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

HuggingFace学习笔记--Model的使用

1--Model介绍

2--AutoModel的使用

2-1--简单Demo

相关文章

Rust UI开发（5）：iced中如何进行页面布局（pick_list的使用）？（串口调试助手）

神经影像和人类基因组关联分析的实践过程

MySQL实现（高可用方案-MHA安装及配置）

力扣295. 数据流的中位数（java，堆解法）

【UGUI】实现UGUI背包系统的六个主要交互功能

使用开源PolarDB和imgsmlr进行高效的图片存储和相似度搜索

MyBatis的强大特性--动态SQL

【java】记一次Java应用查询不到最新数据的问题

JC/T 2087-2011建筑装饰用仿自然面艺术石检测

File类

1+X网络系统建设与运维练习题

虚幻学习笔记1—给UI添加动画

R语言单因素方差分析+差异显著字母法标注+逐行详细解释

5 存储器映射和寄存器

客户案例：EDLP助力金融行业打造高效数据防泄露体系

Qt-No relevant classes found. No output generated问题解决

子类出现和父类同名的成员，子类如何访问父类的同名成员？

融资经理简历模板

什么是网络攻击?阿里云服务器可以避免被攻击吗?

xxl-job适配postgresql数据库