机器学习——CBOW负采样(纯理解）

机器学习——CBOW负采样(纯理解）

news/2025/7/2 13:58:48/文章来源:https://blog.csdn.net/weixin_50348308/article/details/134202438

刚从前一个坑里，勉强爬出来，又掘开另一坑
看了很多文章+B站up主。。。糊里糊涂
但是我发觉，对于不理解的东西，要多看不同up主写的知识分享
书读百遍，其意自现，我是不相信的，容易钻牛角尖
但是，可以多看看一千个哈姆雷特的想法，想法积累多了，一定有那么一刻，让人灵光乍现！！！
拍脑顿悟：原来如此！
给我顿悟的是CSDN的一篇文章Word2Vec详解-公式推导以及代码

CSDN啊，听大神一席话，如长夜得明灯啊！
倒不是其他的文章和up主，没有解释过负采样，但这篇能让我顿悟的点在于：前后对比
我根据它的话理解，应该就是，除了正确的待预测关键词是正样本，其他关键词都是负样本，而负采样方式，主要是对负样本里抽取一些负样本，来计算梯度，并进行反向传播的迭代

这就要拿出之前的基于矩阵的CBOW模型来对比看，在基于矩阵参数的CBOW模型中，是采用多分类的极大似然估计法，来计算一个上下文与所有关键词的关系值的softmax函数值，并同时对所有关键词的u参数向量进行迭代

假设词典D里有N个关键词，那么一个上下文就要对N个关键词进行它们的softmax值，并进行N个u向量的迭代

如果整个语料库有成千上万个上亿个上下文需要预测，那么整个训练的计算量，那可是肥肠肥肠大！

因此，为了降低训练的计算量，可以从N个关键词的计算入手，N个关键词都要计算sigmoid的概率值和迭代，难度太大，能不能只对部分的关键词进行计算和迭代呢？

当然可以！

因此，这就是negative sampling负采样的算法目的：在N个关键词中，只抽取部分关键词来计算和迭代！

首先讲讲抽取原理：负采样

负采样原理

负采样，就是从一堆负样本中，抽取一部分来进行训练

那么如何抽取负样本呢？

负样本抽取

一般是采取 高频词汇，抽取概率更大 的原则。

具体程序，可以另行设计，比如统计词频后，将所有关键词排列成一系列的数据范围，词频大的数据范围也比较大，词频小的数据范围也比较小（可设计程序实现）

然后通过随机数落在哪个范围，就抽取哪个词的方式，来实现抽样

负样本训练

负样本训练，是将抽取到的负样本（不正确的关键词），和上下文对应的正样本（正确的待预测关键词），一起进行计算和迭代。

首先，负样本训练，与【基于矩阵】的计算式是不一样的

【基于矩阵】的计算式，是计算一个上下文与所有关键词的关系概率，再对所有关键词的参数向量u进行迭代

但如果我们进行负采样后，一个上下文，就只需要跟这些负样本和它的正样本进行计算和迭代！

因此，所有的关键词累加符 $Σ_{w∈D}$ ，就改为正样本和负样本的关键词累加符 $Σ_{w=w^*∪{w∈\tilde{w}}}$

下方的 $u$ 迭代不再是针对所有每一个关键词的迭代，而是抽样得到的负样本+正样本的迭代。

待思考的问题

负抽样，是对每一个上下文都分别进行一次负抽样吗？

这样太麻烦了，不妨直接在一次正向+反向传播中，只进行一次负抽样

因为负抽样只与关键词在语料中的词频相关，以及随机的运气，与上下文并无关系

因此，在对所有上下文进行负采样的迭代计算时，可以用同一批负样本进行计算。

至此，我觉得已经非常清晰了，并且参考了大神的word2vec中的数学原理详解
应该就是这样的！！！
负采样不是基于huffman树的hierarchicalsoftmax模型，而是基于输出层的参数是矩阵的基础CBOW模型，并对这个基础模型进行负采样的优化计算。
待我以后有空，再试着用代码试试

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/135010.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

前端-选中DOM定位源代码

前端-选中DOM定位源代码

用到的工具：react-dev-inspector 使用流程根据react-dev-inspector文档进行配置安装 yarn add --dev react-dev-inspector配置：在根目录下配置Inspector import { createRoot } from react-dom/client import { Inspector } from react-dev-inspe…

阅读更多...

draw.io与项目管理——如何利用流程图工具提高项目管理效率

draw.io与项目管理——如何利用流程图工具提高项目管理效率

draw.io 是一款强大的图形绘制工具，用于创建各种类型的图表、流程图、组织结构图、网络图和平面设计等。它提供了丰富的绘图工具和预定义的图形库，使用户能够轻松创建专业水平的图形作品。 draw.io具有直观的界面和简单易用的功能，适合各种用…

阅读更多...

一个拖拽内容到Word的例子

一个拖拽内容到Word的例子

这是一个拖拽内容到Word中的例子。如视频所示： 从程序中的Tree这拖内容到Word中。然后在拖拽完成后事件中，记录日志。拖拽代码如下： typeTForm1 class(TForm)Panel1: TPanel;TreeView1: TTreeView;GroupBox1: TGroupBox;Memo1: TMemo;D…

阅读更多...

Webpack 的作用和工作原理是什么？

Webpack 的作用和工作原理是什么？

Webpack 是一个现代的静态模块打包工具，它的作用是将前端应用程序的各种资源（如 JavaScript、CSS、图片等）视为模块，并将它们打包成可以在浏览器中运行的静态文件。它的主要功能包括模块打包、资源优化、代码分割、加载器转换等。…

阅读更多...

oracle_19c 安装

oracle_19c 安装

oracle安装部署 1、安装docker,docker-compose环境。 curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun curl -L "https://github.com/docker/compose/releases/download/1.14.0-rc2/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/b…

阅读更多...

云计算的大模型之争，亚马逊云科技落后了？

云计算的大模型之争，亚马逊云科技落后了？

文丨智能相对论作者丨沈浪 “OpenAI使用了Azure的智能云服务”——在过去的半年，这几乎成为了微软智能云最好的广告词。正所谓“水涨船高”，凭借OpenAI旗下的ChatGPT在全球范围内爆发，微软趁势拉了一波自家的云计算业务。2023年二季度&a…

阅读更多...

linux 安装 Anaconda3

linux 安装 Anaconda3

文章目录一、下载二、安装1.使用xftp把下载包拉到服务器上2.执行安装命令3、在安装时没有自动添加环境变量，这里手动设置3.1.1通过修改~/.bashrc来配置环境变量3.1.2 重新载入配置文件3.1.3 测试一、下载官网下载链接二、安装 1.使用xftp把下载包拉到服务器上…

阅读更多...

从零开始搭建微服务(二)

从零开始搭建微服务(二)

忘记了软件还没有装全,今天先把所有的软件装上,nacos已经装过了我们就不在装了,剩余的软件全部都是通过docker安装,我在centos7里面 1. 安装docker 安装dockeryum -y install docker开机自启 systemctl enable docker启动dockre systemctl start docker查看docker版本 doc…

阅读更多...

css控制卡片内部的左右布局

css控制卡片内部的左右布局

先放效果图纯css样式可以根据需求进行更改 <template> <div class"card_box "><el-card class"box-card w400" v-for"(item,index) in cardList" :key"index"><div slot"heade…

阅读更多...

【五、http】go的http的信息提交(表单，json，上传文件）

【五、http】go的http的信息提交(表单，json，上传文件）

一、post提交的几种 form表单json文件 1、提交表单 //http的postfunc requstPost(){params : make(url.Values)params.Set("name", "kaiyue")params.Set("age", "18")formDataStr : []byte(params.Encode())formDataByte : bytes.N…

阅读更多...

学习与科学研究总决

学习与科学研究总决

前言学习方法，做学问之道历来为人重视。学习的一般方法看书：课本阅读，查相关资料、论文，都是摄取的形式，是一个知识输入的过程。笔记：课堂笔记，读书笔记，写博客，发…

阅读更多...

【python 学习】代码插桩调试

【python 学习】代码插桩调试

Python 代码插桩方法文章目录 Python 代码插桩方法什么是插桩技术？使用插桩调试python插桩的一种实现方法什么是插桩技术？ 插桩技术是指在保持原有程序逻辑完整性的基础上，在程序中加入探针，通过探针来收集代码在执行过程中的信…

阅读更多...

力扣 LCR 024. 反转链表两种解法

力扣 LCR 024. 反转链表两种解法

目录 1.解题思路Ⅰ2.代码实现Ⅰ3.解题思路Ⅱ4.代码实现Ⅱ 1.解题思路Ⅰ 利用头插法，遍历数组将后面的元素头插到前面的元素. 2.代码实现Ⅰ struct ListNode* reverseList(struct ListNode* head) { struct ListNode*curhead;;struct ListNode*newheadNULL;whil…

阅读更多...

网络工程实验记录

网络工程实验记录

网络工程 show ip route show running-config 第一周相同设备使用交叉线，不同设备之间使用直通线 R1能ping通10.1.1.1 R2能ping通所有的 R3能ping通172.16.1.1 即路由器只能到达自身线连接出去的，另一端就连接不了了。此时给R1分配静态路由 R…

阅读更多...

单线程介绍、ECMAScript介绍、操作系统Windows、Linux 和 macOS

单线程介绍、ECMAScript介绍、操作系统Windows、Linux 和 macOS

目录单线程介绍ECMAScript介绍操作系统Windows、Linux 和 macOS 👍 点赞，你的认可是我创作的动力！ ⭐️ 收藏，你的青睐是我努力的方向！ ✏️ 评论，你的意见是我进步的财富！ 单线程介绍单线…

阅读更多...

Spring Security OAuth 2.0 资源服务器— JWT

Spring Security OAuth 2.0 资源服务器— JWT

目录一、JWT的最小依赖二、JWT的最基本配置 1、指定授权服务器 2、初始预期（Startup Expectations） 3、运行时预期（Runtime Expectations） 三、JWT认证是如何工作的四、直接指定授权服务器 JWK Set Uri 五、提供 audie…

阅读更多...

kimera论文阅读

kimera论文阅读

文章目录功能构成：Kimera线程A. Kimera-VIO:B. Kimera-RPGO:C. Kimera-Mesher:D. Kimera-Semantics:E.调试工具功能构成： Kimera包括四个关键模块: Kimera-VIO的核心是基于gtsam的VIO方法[45]，使用IMUpreintegration和无结构视觉因子[27]…

阅读更多...

通达OA get_datas.php前台sql注入-可获取数据库session登入后台漏洞复现 [附POC]

通达OA get_datas.php前台sql注入-可获取数据库session登入后台漏洞复现 [附POC]

文章目录通达OA get_datas.php前台sql注入-可获取数据库session登入后台漏洞复现 [附POC]0x01 前言0x02 漏洞描述0x03 影响版本0x04 漏洞环境0x05 漏洞复现1.访问漏洞环境2.构造POC3.复现 0x06 修复建议通达OA get_datas.php前台sql注入-可获取数据库session登入后台漏洞复现…

阅读更多...

读书笔记：彼得·德鲁克《认识管理》第8章战略规划：企业家技能

读书笔记：彼得·德鲁克《认识管理》第8章战略规划：企业家技能

一、章节内容概述战略规划帮助做好当前的业务以迎接未来。战略规划需要思考业务应该是什么，当前必须做什么才能赢得未来。战略规划需要进行风险决策，需要有组织地抛弃过去的业务，要求清晰界定和明确安排为实现理想的未来而开展的工作。战略…

阅读更多...

YOLOv8-Cls推理详解及部署实现

YOLOv8-Cls推理详解及部署实现

目录前言一、YOLOv8-Cls推理(Python)1. YOLOv8-Cls预测2. YOLOv8-Cls预处理3. YOLOv8-Cls推理二、YOLOv8-Cls推理(C)1. ONNX导出2. YOLOv8-Cls预处理3. YOLOv8-Cls推理三、YOLOv8-Cls部署1. 源码下载2. 环境配置2.1 配置CMakeLists.txt2.2 配置Makefile 3. ONNX导出4. 源码修…

阅读更多...

最新文章