【深度学习】再谈向量化

news/2025/4/27 12:51:51/文章来源:https://blog.csdn.net/weixin_44750512/article/details/131002913

前言

向量化是一种思想，不仅体现在可以将任意实体用向量来表示，更为突出的表现了人工智能的发展脉络。向量的演进过程其实都是人工智能向前发展的时代缩影。

1.为什么人工智能需要向量化

电脑如何理解一门语言？电脑的底层是二进制也就是0和1，所有的文字，音频和视频都是一串数字，这结构很简单，但是有一个问题，没有规律。比如我们使用一个32位的数字代表“苹”，使用另一个32位的数字代表“果”，那么“苹果”在电脑中就是一串0和1组成的数。

电脑并不知道这串数字代表的是一个水果。科学家在对字母或者汉字编码的时候，只考虑到了存储和显示的需要，并不会顾及他的实际意义。举例说明：美的编号是39，丑是40，爱是41，宇宙的答案是42，数字和文字生拉硬套的表示，之间不存在任何联系，也就无法承载文字本身的意义。所以，电脑既不记录意义，也不理解意义。

非人工智能时代，电脑只是我们存储和处理信息的一种工具，就如同存储和处理食物的冰箱和锅一样，他们并不需要认识冰激凌和鱼香肉丝，使用它们的人认识冰激凌，知道怎么做鱼香肉丝就可以了，但是人工智能时代，我们需要电脑自己处理现实世界的信息，人工智能需要自己解决问题，以机器翻译为例，本质上是两种不同的语言对应同一个实际意义，AI需要自己找到这种对应关系，才能进行翻译。

也就是说，电脑需要了解语言的实际意义。如何理解呢？答案是向量化。

2.如何向量化

那什么是向量化呢？简单来说，就是将你想要表示的东西变成一组数字的组合。举一个简单的例子，如何用数字来定义一个人？可以尝试给他设置各种衡量维度。

比如我们用[0,180,75,20] 来表示一个人，并给予每个维度以对应的解释。第一维代表性别、第二维表示身高、第三维代表体重、第四维代表年龄，这样通过一组4维数组就表示出一位身高为180，体重位75KG，年龄为20岁的男性。另外还可以扩展维度表示，将【性别，身高，体重，年龄，胸围，腰围，臀围，体脂率，肤色，发色，爱好，学历，收入...】,维度越多，那对一个人的定义就越准确。

3.向量化后的优势

那向量化后的表示有什么好处呢？ 1.方便电脑处理。2.向量化后的空间，展现了一定的规律。

我们以身高和体重为维度，通过这些维度筛选出来的人([180,76])，跟我们定义的人([180,75])的相似度就越高。在坐标中与你距离最近的人，也就是和你最相似的人。而我们增加更多的维度，那衡量标准就越多，在更高维度的坐标系中，我们就能够通过空间关系，理解每个人的特征。

同样对于词语的表示，我们也通过向量化，只不过是词语的向量化更加的抽象，表示它的维度也更不容易被总结出来，但如果我们同样把他们放在一个很高维度的坐标里，那意义相近的词语，他们的空间就会越接近。

向量是可以计算的，当我们把词语放进向量空间后，国王的向量减去男人的向量再加上女人的向量，得出的向量值和女王或者王后的位置非常接近，这说明了在一个合适的维度坐标中，词语之间的空间关系反映了他们在现实世界中的实际关系。

4.总结

向量化于人工智能时代而言，有着里程碑式的意义。人工智能与向量化，就如同西方与耶路撒冷。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/34899.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Arduino+esp32学习笔记

Arduino+esp32学习笔记

学习目标： 使用Arduino配置好蓝牙或者wifi模块学习使用python配置好蓝牙或者wifi模块学习内容（笔记）： 一、 Arduino语法基础 Arduino语法是基于C的语法,C又是c基础上增加了面向对象思想等进阶语言。那就只记录没见过的。单多…

阅读更多...

全国各城市-货物进出口总额和利用外资-外商直接投资额实际使用额（1999-2020年）

全国各城市-货物进出口总额和利用外资-外商直接投资额实际使用额（1999-2020年）

最新数据显示，全国各城市外商直接投资额实际使用额在过去一年中呈现了稳步增长的趋势。这一数据为研究者提供了对中国外商投资活动的全面了解，并对未来投资趋势和政策制定提供了重要参考。首先，这一数据反映了中国各城市作为外商投资的热门目…

阅读更多...

Effective Java笔记（31）利用有限制通配符来提升 API 的灵活性

Effective Java笔记（31）利用有限制通配符来提升 API 的灵活性

参数化类型是不变的（ invariant ） 。换句话说，对于任何两个截然不同的类型 Typel 和 Type2 而言， List<Type1 ＞既不是 List<Type 2 ＞ 的子类型，也不是它的超类型。虽然 L ist<String…

阅读更多...

Oracle自定义函数生成MySQL表结构的DDL语句

Oracle自定义函数生成MySQL表结构的DDL语句

1. 自定义函数fnc_table_to_mysql create or replace function fnc_table_to_mysql ( i_owner in string, i_table_name in string, i_number_default_type in string : decimal, i_auto_incretment_column_name in stri…

阅读更多...

Linux 文件查看命令

Linux 文件查看命令

一、cat命令 1.cat文件名，查看文件内容： 例如，查看main.c文件的内容： 2.cat < 文件名，往文件中写入数据， Ctrld是结束输入例如，向文件a.txt中写入数据： 查看刚刚写入a.txt的…

阅读更多...

Yolov5(一)VOC划分数据集、VOC转YOLO数据集

Yolov5(一)VOC划分数据集、VOC转YOLO数据集

代码使用方法注意修改一下路径、验证集比例、类别名称，其他均不需要改动，自动划分训练集、验证集、建好全部文件夹、一键自动生成Yolo格式数据集在当前目录下，大家可以直接修改相应的配置文件进行训练。目录使用方法： 全部代码…

阅读更多...

解决监督学习，深度学习报错：AttributeError: ‘xxx‘ object has no attribute ‘module‘！！！！

解决监督学习，深度学习报错：AttributeError: ‘xxx‘ object has no attribute ‘module‘！！！！

哈喽小伙伴们大家好呀，很长时间没有更新啦，最近在研究一个问题，就是AttributeError: xxx object has no attribute module 今天终于是解决了，所以来记录分享一下： 我这里出现的问题是： 因为我的数据比较大…

阅读更多...

SQL优化

SQL优化

一、插入数据优化 1.1 普通插入（小数据量） 普通插入（小数据量）： 采用批量插入（一次插入的数据不建议超过1000条）手动提交事务主键顺序插入 1.2 大批量数据插入大批量插入：&…

阅读更多...

Android 开发中需要了解的 Gradle 知识

Android 开发中需要了解的 Gradle 知识

作者：wkxjc Gradle 是一个基于 Groovy 的构建工具，用于构建 Android 应用程序。在 Android 开发中，了解 Gradle 是非常重要的，因为它是 Android Studio 默认的构建工具，可以帮助我们管理依赖项、构建应用程序、运行测试…

阅读更多...

macOS 如何安装git和nvm

macOS 如何安装git和nvm

首先：先来安装git 打开macOS终端将下面的命令复制粘贴进去： curl -O https://mirrors.edge.kernel.org/pub/software/scm/git/git-2.41.0.tar.gz 版本号可以参考一下官网的我这里安装的是目前最新的2.41.0 然后在终端输入下面的代码或者双击git的…

阅读更多...

数据结构：力扣OJ题

数据结构：力扣OJ题

目录编辑题一：链表分割思路一： 题二：相交链表思路一： 题三：环形链表思路一： 题四：链表的回文结构思路一： 链表反转： 查找中间节点： 本人实力…

阅读更多...

YOLOv8+ByteTrack多目标跟踪(行人车辆计数与越界识别)

YOLOv8+ByteTrack多目标跟踪(行人车辆计数与越界识别)

课程链接：https://edu.csdn.net/course/detail/38901 ByteTrack是发表于2022年的ECCV国际会议的先进的多目标跟踪算法。YOLOv8代码中已集成了ByteTrack。本课程使用YOLOv8和ByteTrack对视频中的行人、车辆做多目标跟踪计数与越界识别，开展YOLOv8目标检测…

阅读更多...

Leetcode每日一题：23. 合并 K 个升序链表（2023.8.12 C++）

Leetcode每日一题：23. 合并 K 个升序链表（2023.8.12 C++）

目录 23. 合并 K 个升序链表题目描述： 实现代码与解析： 优先级队列： 原理思路： 23. 合并 K 个升序链表题目描述： 给你一个链表数组，每个链表都已经按升序排列。请你将所有链表合并到一个升序链表…

阅读更多...

Flutter: A RenderFlex overflowed by 42 pixels on the bottom.

Flutter: A RenderFlex overflowed by 42 pixels on the bottom.

Flutter：渲染活动底部上方溢出了42个像素 Flutter 控件超出异常：A RenderFlex overflowed by 42 pixels on the bottom. 解决方案 1.Scaffold内添加 resizeToAvoidBottomInset 属性，缺点是软键盘下面的控件被挡住 Scaffold( resizeToAvoidBot…

阅读更多...

第一百二十七天学习记录：我的创作纪念日

第一百二十七天学习记录：我的创作纪念日

机缘今天收到CSDN官方的来信，想想也可以对我前面的学习记录进行一个总结。关于来到CSDN的初心，也就是为了让自己养成一个良好的学习总结的习惯。这里要感谢我C语言视频教程的老师，是他建议学生们在技术博客中进行记录。对于技术博客&…

阅读更多...

web-Element

web-Element

在vueapp里<div><element-view></element-view></div> <div><element-view></element-view></div>在view新建个文件 <t…

阅读更多...

C++ VTK 8.2 如何绘制弹簧图形

C++ VTK 8.2 如何绘制弹簧图形

//创建圆柱 vtkSmartPointer<vtkCylinderSource> spCylinderSource vtkSmartPointer<vtkCylinderSource>::New(); spCylinderSource->SetHeight(m_dCylinderHeight); // 设置圆柱的高度 spCylinderSource->SetRadius(m_dCylinderRadius)…

阅读更多...

Spring(12) BeanFactory 和 ApplicationContext 区别

Spring(12) BeanFactory 和 ApplicationContext 区别

目录一、BeanFactory 和 ApplicationContext 区别？二、既然 Spring Boot 中使用的是 ApplicationContext 进行应用程序的启动和管理，那么 Spring Boot 会用到 BeanFactory 吗？ 一、BeanFactory 和 ApplicationContext 区别？ Bea…

阅读更多...

git clone使用https协议报错OpenSSL SSL_read: Connection was reset, errno 10054

git clone使用https协议报错OpenSSL SSL_read: Connection was reset, errno 10054

在使用git 下载github上的代码时， 一般有ssh协议和https协议两种。使用ssh协议可以成功clone代码， 但使用https协议时出错： $ git clone https://github.com/openai/improved-diffusion.git Cloning into improved-diffusion... fatal: unab…

阅读更多...

vue或uniapp使用pdf.js预览

vue或uniapp使用pdf.js预览

一、先下载稳定版的pdf.js，可以去官网下载官网下载地址或 pdf.js包下载(已配置好，无需修改) 二、下载好的pdf.js文件放在public下静态文件里， uniapp是放在 static下静态文件里三、使用方式 1. vue项目注意路径 :src"static/pd…

阅读更多...

最新文章