多模态笔记

多模态笔记

news/2025/4/5 3:26:34/文章来源:https://blog.csdn.net/a130098300/article/details/133942790

Transformer

对文本输入进行tokenizer时，调用的接口batch_encode_plus，过程大致是这样的(参考：tokenizer用法)

#这里以bert模型为例，使用上述提到的函数
from transformers import BertTokenizer
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
text = "It's a nice day today!"
#tokenize,#仅用于分词
seg_words = tokenizer.tokenize(text)  
print("tokenize分词结果：\n",seg_words)
#convert_tokens_to_ids，将token转化成id，在分词之后。
#convert_ids_to_tokens,将id转化成token，通常用于模型预测出结果，查看时使用。
seg_word_id = tokenizer.convert_tokens_to_ids(seg_words)  
print("tokenize Id:\n",seg_word_id)
#encode,进行分词和token转换，encode=tokenize+convert_tokens_to_ids
encode_text = tokenizer.encode(text)
print("encode结果：\n",encode_text)
#encode_plus,在encode的基础之上生成input_ids、token_type_ids、attention_mask
encode_plus_text = tokenizer.encode_plus(text)
print("encode_plus结果：\n",encode_plus_text)
#batch_encode_plus,在encode_plus的基础之上，能够批量梳理文本。
batch_encode_plus_text = tokenizer.batch_encode_plus([text,text])
print("batch_encode_plus结果：\n",batch_encode_plus_text)

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/116724.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

spring tx:advice事务配置—— tx:advice中不允许出现属性 ‘transaction-manager‘

spring tx:advice事务配置—— tx:advice中不允许出现属性 ‘transaction-manager‘

今天在配置java事务管理时出现了一些问题。提示：只有这几个属性经过查询资料发现是bean的配置少了一些。可以在xml文件顶部添加： xmlns:tx"http://www.springframework.org/schema/tx" 下面也提供一份bean文件配置的模板： &a…

阅读更多...

下列软件包有未满足的依赖关系： libqt5svg5-dev : 依赖: libqt5svg5 (= 5.12.8-0ubuntu1) 但是它将不会被安装

下列软件包有未满足的依赖关系： libqt5svg5-dev : 依赖: libqt5svg5 (= 5.12.8-0ubuntu1) 但是它将不会被安装

有一些软件包无法被安装。如果您用的是 unstable 发行版，这也许是因为系统无法达到您要求的状态造成的。该版本中可能会有一些您需要的软件包尚未被创建或是它们已被从新到(Incoming)目录移出。下列信息可能会对解决问题有所帮助： 下列软件包有未满足…

阅读更多...

Java入门讲解(1)---让你瞬间明白如何安装jdk

Java入门讲解(1)---让你瞬间明白如何安装jdk

博主有话说：学习这个东西一定要持之以恒！！！博主之前因为点事情半个月没学习，重新来过时，发现自己错过好多知识，正在一点一点往回补，博客也会陆续开始更新，希望大家多多支…

阅读更多...

HarmonyOS SDK，赋能开发者实现更具象、个性化开发诉求

HarmonyOS SDK，赋能开发者实现更具象、个性化开发诉求

#鸿蒙生态千帆起#随着移动互联网的逐步成熟，用户的需求越来越细化。鸿蒙生态为开发者提供的HarmonyOS SDK开放能力，高效赋能美团外卖等合作伙伴实现更具象、个性化的开发诉求，给用户提供更丰富便捷的体验。 HarmonyOS SDK，赋能开发…

阅读更多...

pb:数据处理窗口CloseQuery事件编程、如何在窗口之间传递结构

pb:数据处理窗口CloseQuery事件编程、如何在窗口之间传递结构

1、数据处理窗口CloseQuery事件编程该事件下的脚本流程是首先判断数据是否修改过，如果修改过，则让用户选择是否保存，用户确认保存则保存，不保存则退回事务然后关闭窗口。保存数据时，保存成功则直接关闭窗口，保存失败则让用户确认是否关闭窗口，用户确认要关闭则关闭窗口…

阅读更多...

【AI视野·今日CV 计算机视觉论文速览第272期】Fri, 20 Oct 2023

【AI视野·今日CV 计算机视觉论文速览第272期】Fri, 20 Oct 2023

AI视野今日CS.CV 计算机视觉论文速览 Fri, 20 Oct 2023 Totally 62 papers 👉上期速览✈更多精彩请移步主页 Daily Computer Vision Papers Putting the Object Back into Video Object Segmentation Authors Ho Kei Cheng, Seoung Wug Oh, Brian Price, Joon Youn…

阅读更多...

(二)docker：建立oracle数据库mount startup

(二)docker：建立oracle数据库mount startup

这章其实我想试一下startup部分做mount，因为前一章在建完数据库容器后，需要手动创建用户，授权，建表等，好像正好这部分可以放到startup里，在创建容器时直接做好；因为setup部分我实在没想出来能做…

阅读更多...

php对接飞书机器人

php对接飞书机器人

有同事接到对接飞书机器人任务，开发中遇到响应错误： {"code": 19021,"msg": "sign match fail or timestamp is not within one hour from current time" } 意思应该就是签名错误或者时间戳不在有效范围内等&#xff0c…

阅读更多...

【Python】取火柴小游戏（巴什博弈）

【Python】取火柴小游戏（巴什博弈）

火柴游戏：Python编程示例当我们想要玩一个简单而有趣的游戏，同时又想锻炼自己的编程技能时，一个经典的选择就是火柴游戏。这个游戏的规则很简单：有一堆火柴，每次可以拿走1到6根，两名玩家轮流取火柴&#…

阅读更多...

Java NIO

Java NIO

Java NIO 一，介绍 Java NIO（New IO）是 JDK 1.4 引入的一组新的 I/O API，用于支持非阻塞式 I/O 操作。相比传统的 Java IO API，NIO 提供了更快、更灵活的 I/O 操作方式，可以用于构建高性能网络应用程序。 …

阅读更多...

京东数据分析：2023年9月京东白酒行业品牌销售排行榜

京东数据分析：2023年9月京东白酒行业品牌销售排行榜

鲸参谋监测的京东平台9月份白酒市场销售数据已出炉！ 9月白酒市场的整体热度较高，贵州茅台先是与瑞幸联名推出酱香拿铁，后又宣布与德芙推出联名产品酒心巧克力，引起了诸多消费者的关注。在这一热度的加持下，从销售上看&…

阅读更多...

深入理解Redis集群模式、协议、元数据维护方式

深入理解Redis集群模式、协议、元数据维护方式

文章目录 🍊 集群模式🍊 集群协议🍊 元数据维护方式🎉 集中式🎉 gossip 协议 📕我是廖志伟，一名Java开发工程师、Java领域优质创作者、CSDN博客专家、51CTO专家博主、阿里云专家博主、清华大学出…

阅读更多...

第01章-Java语言概述

第01章-Java语言概述

目录 1 常见DOS命令常用指令相对路径与绝对路径 2 转义字符 3 安装JDK与配置环境变量 JDK与JRE JDK的版本 JDK的下载 JDK的安装配置path环境变量 4 Java程序的编写与执行 5 Java注释 6 Java API文档 7 Java核心机制：JVM 1 常见DOS命令 DOS（…

阅读更多...

52832 3通道ADC笔记

52832 3通道ADC笔记

因为业务需要, 需要在52832上, 采集3个pin的电压. 52832的ADC, 分为什么single, 连续, 扫描模式 single就是只有一个通道并采集一次, 连续就是不停的扫描, 如果要捕捉声音之类, 就配合DMA, 连续不停的采集, 转换就行了. 扫描模式就是如果是多通道, 就一开始初始化多个通道, 存放…

阅读更多...

Lua-http库写一个爬虫程序怎么样？

Lua-http库写一个爬虫程序怎么样？

以下是一个使用Lua-http库编写的一个爬虫程序，该爬虫使用Lua语言来抓取www.snapchat.com的内容。代码必须使用以下代码：get_proxy -- 导入所需的库 local http require("http") local json require("json")-- 定义爬虫IP服务器 …

阅读更多...

安装docker ，更换docker版本

安装docker ，更换docker版本

docker dockerd & containerd Dockerd（Docker 守护进程）在其底层使用 Containerd 来管理容器。Containerd 是一个开源的容器运行时管理器，由 Docker 公司于2017年开发并开源，它负责实际的容器生命周期管理。以下是 Docker 守…

阅读更多...

力扣每日一题49：字母异位词分组

力扣每日一题49：字母异位词分组

题目描述： 给你一个字符串数组，请你将字母异位词组合在一起。可以按任意顺序返回结果列表。字母异位词是由重新排列源单词的所有字母得到的一个新单词。示例 1: 输入: strs ["eat", "tea", "tan", "ate&quo…

阅读更多...

清华训练营悟道篇之浅谈操作系统

清华训练营悟道篇之浅谈操作系统

文章目录前言系统软件执行环境操作系统的功能操作系统组成前言操作系统是一个帮助用户和应用程序使用和管理计算机资源的软件，它控制着嵌入式设备、更通用的系统（如智能手机、台式计算机和服务器）以及巨型机等各种计算机系统系统软件 …

阅读更多...

Element的MessageBox自定义图标

Element的MessageBox自定义图标

Element的MessageBox 弹框如何自定义图标_如何替换 el message box 的图标-CSDN博客

阅读更多...

【前段基础入门之】=＞CSS3新增渐变颜色属性

【前段基础入门之】=＞CSS3新增渐变颜色属性

导语： CSS3 新增了，渐变色的解决方案，这使得我们可以绘制出更加生动的炫酷的的配色效果线性渐变多个颜色之间的渐变， 默认从上到下渐变 background-image: linear-gradient(red,yellow,green); /*默认从上到下渐变*/默认从上…

阅读更多...

最新文章