Sentence Transformers x SwanLab:可视化Embedding训练

Sentence Transformers(又名SBERT)是访问、使用和训练文本和图像嵌入(Embedding)模型的Python库。

在这里插入图片描述

你可以使用Sentence Transformers快速进行模型训练,同时使用SwanLab进行实验跟踪与可视化。

1. 引入SwanLabCallback

from swanlab.integration.huggingface import SwanLabCallback

SwanLabCallback是适配于HuggingFace系列工具(Transformers等)的日志记录类。

SwanLabCallback可以定义的参数有:

  • project、experiment_name、description 等与 swanlab.init 效果一致的参数, 用于SwanLab项目的初始化。
  • 你也可以在外部通过swanlab.init创建项目,集成会将实验记录到你在外部创建的项目中。

2. 传入Trainer

from swanlab.integration.huggingface import SwanLabCallback
from sentence_transformers import SentenceTransformer, SentenceTransformerTrainer...# 实例化SwanLabCallback
swanlab_callback = SwanLabCallback(project="hf-visualization")trainer = SentenceTransformerTrainer(...# 传入callbacks参数callbacks=[swanlab_callback],
)trainer.train()

3.完整案例代码

from datasets import load_dataset
from sentence_transformers import SentenceTransformer, SentenceTransformerTrainer
from sentence_transformers.losses import MultipleNegativesRankingLoss
from swanlab.integration.huggingface import SwanLabCallbackmodel = SentenceTransformer("bert-base-uncased")train_dataset = load_dataset("sentence-transformers/all-nli", "pair", split="train[:10000]")
eval_dataset = load_dataset("sentence-transformers/all-nli", "triplet", split="dev")
mnrl_loss = MultipleNegativesRankingLoss(model)swanlab_callback = SwanLabCallback(project="sentence-transformers", experiment_name="bert-all-nli")trainer = SentenceTransformerTrainer(model=model,train_dataset=train_dataset,eval_dataset=eval_dataset,loss=mnrl_loss,callbacks=[swanlab_callback],
)trainer.train()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/27670.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

lwip中server和client的socket、地址和端口号

1、server的socket通过lwip_socket建立: server_sd lwip_socket(AF_INET, SOCK_STREAM, 0);2、client的socket在监听到连接后建立: client_sd lwip_accept(server_sd, (struct sockaddr *)&client_addr_port, (socklen_t *)&size);3、server…

【STM32】基于RTOS的CAN异步接收转发数据

文章目录 前言实现 前言 现象:全局变量在 CAN 中断中存储数据,并设置同步标志,在主程序中检测标志后,打包并转发 CAN 数据,会出现 CAN 数据错乱 现象分析:CAN 数据打包处理过程中,新的数据到来…

AI时代新爬虫:网站自动转LLM数据,firecrawl深度玩法解读

在大模型的时代,爬虫技术也有了很多新的发展,最近出现了专门针对大模型来提取网站信息的爬虫,一键将网页内容转换为LLM-ready的数据。今天我们介绍其中的开源热门代表:firecrawl。 firecrawl 是什么 FireCrawl是一款创新的爬虫工…

《2023-2024中国数据资产发展研究报告》

中国电子信息产业发展研究院发布《2023-2024中国数据资产发展研究报告》(下称《报告》),紧跟国家战略部署,调研国内数据资产发展现状,掌握数据价值实现路径,助力释放数字经济新动能。 《报告》从数据资产相…

这家来自内蒙古的物流企业,用另一种方式减碳超500吨

2016年,多蒙德实业集团整合旗下物流及运销板块,组建成立了内蒙古多蒙德科技有限公司(以下简称“多蒙德”),整合互联网、大数据及智慧物流为一体,自主研发多蒙达网络货运平台及多个供应链智慧系统&#xff0…

pytest + yaml 框架 -62.支持yaml和json2种格式用例

前言 v1.5.7版本开始新增json格式用例支持,本次版本改动内容 1.支持 .json 文件用例2.优化日志中文件后缀名称.yml .yaml .json3.ruamel.yaml 版本兼容0.18.6yaml 格式用例 yaml 格式用例示例,test_a.yml test_demo:name: postrequest:method: POSTurl: http://httpbin.or…

24年下教资笔试报名照片要求及处理方法

24年下教资笔试报名照片要求及处理方法

关闭kylin(麒麟)系统的安全认证(烦人的安全认证)

打开grub sudo vim /etc/default/grup修改安全认证选项 增加12行,把13行注释掉 保存更改, 然后执行下面的命令: sudo sync sudo reboot重启成功后,就关闭了安全认证了~~~~~。 总体来讲,kylin还是基于ubuntu的内核的,…

文章解读与仿真程序复现思路——电工技术学报EI\CSCD\北大核心《考虑源网储协同配合下的移动式波浪能发电平台并网优化调度》

本专栏栏目提供文章与程序复现思路,具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

PostgreSQL基础知识

PostgreSQL简介 PostgreSQL是一个强大的开源对象关系数据库系统,它使用并扩展了SQL语言,并结合了许多功能,可以安全地存储和扩展最复杂的数据工作负载。PostgreSQL的起源可以追溯到1986年,是加州大学伯克利分校POSTGRES项目的一部…

细说ARM MCU的串口接收数据的实现过程

目录 一、硬件及工程 1、硬件 2、软件目的 3、创建.ioc工程 二、 代码修改 1、串口初始化函数MX_USART2_UART_Init() (1)MX_USART2_UART_Init()串口参数初始化函数 (2)HAL_UART_MspInit()串口功能模块初始化函数 2、串口…

深入解析Prometheus:强大的开源监控与告警系统

目录 引言 一、运维监控平台的设计思路 (一)设计思路 1.数据收集模块 2.数据提取模块 3.监控告警模块 (二)监控平台层级 二、Prometheus简介 (一)基本介绍 (二)核心特征 …

Wake Lock API:保持设备唤醒的利器

随着移动设备和 Web 应用的普及,如何有效管理设备的电源成为开发者们关注的一个重要问题。Wake Lock API 是一种强大的工具,它允许 Web 应用请求设备保持唤醒状态,从而防止屏幕变暗或设备进入睡眠模式。在这篇文章中,我们将详细介…

vue+elementUI实现在表格中添加输入框并校验的功能

背景: vue2elmui 需求: 需要在一个table中添加若干个输入框,并且在提交时需要添加校验 思路: 当需要校验的时候可以考虑添加form表单来触发校验,因此需要在table外面套一层form表单,表单的属性就是ref…

救命!接手了一个老项目,见到了从业10年以来最烂的代码!

后台回复“书籍”,免费领取《程序员书籍资料一份》 后台回复“5000”,免费领取面试技术学习资料一份 在程序员这个行业从业快10年了,每过几个月回头看看自己写的代码,都会觉得写的也太烂了,不敢想象是自己之前写的。…

2024黄河流域比赛的复现

目录 WEB [GKCTF 2021]easynode unser 知识点 WEB 根据此题先复现[GKCTF 2021]easynode这个题,这两个题类似 [GKCTF 2021]easynode 1.打开页面发现是登录页面,找到源文件里面的代码,分析如何进行登录,发现经过safeQuery()函…

【C++】基础复习 运算符|算数、关系、逻辑、赋值、位运算符

文章目录 1 算术运算符1.1 整数除法1.2 浮点数除法1.3 混合运算 2 关系运算符3 逻辑运算符4 赋值运算符5 位运算符6 条件运算符(三元运算符)7 其他重点补充 1 算术运算符 算术运算符用于执行基本的数学运算。 运算符描述示例结果加法a b两数相加-减法…

2024年6月13日随笔

现在已经是6月14日了,十二点多了,宿舍依旧很吵,根本睡不着,索性下来写篇随笔,已经好久没写过随笔了,最近这两个月都很忙,双学位的考试,两个课程设计,还有其他一些杂七杂八…

Docker使用心得

Docker使用心得 最近使用Docker比较频繁,特此想记录一下,方便后续查找。 Docker常用命令Docker如何配置使用GPU环境?如何使用Dockerfile构建镜像?如何使用docker compose 实例化容器? Docker如何配置使用GPU环境 参…

深度学习 - CNN

第一部分:基础知识 1. 什么是卷积神经网络(CNN) 定义和基本概念 卷积神经网络(CNN)是一种专门用于处理具有网格结构数据(如图像)的深度学习模型。它们在图像识别和计算机视觉领域表现尤为突出…