BoW(词袋Bag of words)

Bag-of-words词袋模型最初被用在信息检索领域。例如检索一篇文档,只需考虑文档中出现单词的频率,而不用考虑语法语序等。在图像领域,如果把一幅图像当作文档,图像中的图像块的特征向量视为文档内的词,BoW在图像领域也可以取得很好的效果。这个过程可以分为几步:提取特征,训练虚拟词表,量化特征,用虚拟词频表示图片。

1、特征提取

  • 检测图像块
  • 归一化图像块
  • 用SIFT描述器表示

2、训练虚拟词表

通过聚类(k-means)的方法,把所有SIFT表示的特征归为几类,这些归类的特征可视为虚拟词表(visual vocabulary)。

每一个归类的特征(cluster center)被称为虚拟词(visual word),然后量化特征。

3、用词频表表示图片

统计图像中每个词在图像中出现的频率,用频率直方图表示。

4、BoW在图像检索中的应用

4.1 构建数据库

  • 提取数据库图像的特征向量
  • 训练所有图像的词表
  • 计算每一个词的权重
  • 创建词-图的映射

4.2 TF-IDF(term frequency-inverse document frequency)权重

单词 j 的IDF(逆文本频率)计算公式:

IDF(j)=\log\left (\frac{number\;all\;documents}{number\;of\;documents\;j \;appears} \right )

单词 j 的TF(词频)计算公式:

TF(j)=\frac{number\;of\;documents\;j\;appear}{number\;of\;documents\;of\;all\;words}

单词 j 的TF-IDF计算公式:

TF-IDF(j)=TF(j)\times IDF(j)

TF-IDF的值越大说明这个词也重要,也就是关键词。

4.3 创建词-图映射

把词映射到文档

5、图像的空间金字塔(Spatial pyramid)

计算每一块的直方图

计算金字塔图的每一个小区域的直方图

把金字塔和直方图结合在一起进行比较,判断匹配项

 

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/492185.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

欧盟最新《AI网络安全政策发展框架》

来源:学术plus报告主要内容编译如下下载全文报告请参见文末链接一、 概要AI进入主流商用,数据收集是关键在过去几年,人工智能(AI)迅速超越研究和学术范畴,进入主流商用,创新的自主代理利用人工智…

2019上海车展重磅新车前瞻

来源:中信建投分析师:余海坤、陶亦然第十八届上海国际汽车工业展览会将于2019年4月18日至25日在上海国家会展中心举行。本次车展的主题为“共创美好生活”,将展现世界汽车工业的创新发展,将汽车与信息通讯、互联网、大数据、人工智…

HDU 4190 Distributing Ballot Boxes【二分答案】

题意&#xff1a;给出n个城市&#xff0c;n个城市分别的居民&#xff0c;m个盒子&#xff0c;为了让每个人都投上票&#xff0c;问每个盒子应该装多少张票 二分盒子装的票数&#xff0c; 如果mid<m,说明偏大了&#xff0c;r应该向下逼近 &#xff0c;rmid 如果mid>m,说明…

局部特征检测器和描述符

图像匹配有三个步骤&#xff1a;检测特征点&#xff0c;特征描述和匹配 1、检测特征点 好的特征点的位置不随图像亮度变换的改变&#xff0c;只与图像的几何变换有关。 1.1 图像变换 1.1.1 几何变换&#xff1a;旋转和伸缩 1.1.2 亮度变换 1.2 Harris角点检测的性质 角点的…

5G+AI系列研究:5G元年,电子行业迎来新时代​

来源&#xff1a;国泰君安证券摘要&#xff1a;本报告作为【5GAI】系列报告的第一篇&#xff0c;主要包括两部分内容&#xff0c;PART A&#xff1a;5G带来终端射频新机遇&#xff1b;PART B&#xff1a;基站建设启动&#xff0c;产业链爆发在即。附报告部分PPT&#xff1a;未来…

卷积神经网络(CNN:Convolutional Neural Network)

1、感知器&#xff08;perceptron&#xff09; 感知器是卷积神经网络的基本单元&#xff0c;下图展示了其工作原理&#xff0c;为了方便理解&#xff0c;图中只显示了3个输入。 向量w为输入向量x的权重&#xff0c;b为偏差&#xff0c;最后对x的线性组合&#xff08;&#xff…

性能调优:理解Set Statistics Time输出

性能调优&#xff1a;理解Set Statistics Time输出 原文:性能调优&#xff1a;理解Set Statistics Time输出在性能调优&#xff1a;理解Set Statistics IO输出我们讨论了Set Statistics IO&#xff0c;还有如何帮助我们进行性能调优。这篇文章会讨论下Set Statistics Time&…

Nature Communications:实时记录神经系统,解开大脑秘密

来源&#xff1a;神经科技人的大脑中大概有一千亿个神经元&#xff0c;每一个神经元都连接到数以百计的神经元邻居。分析大脑中的神经活动和致此活动的原因&#xff0c;一直是科学家们研究的目标。现在&#xff0c;一组科学家设计出整个神经系统高速映射神经元放电的成像技术&a…

图像变换(Image transformations)

1 图像变换和图像滤波&#xff08;image filtering&#xff09;的区别 1.1 图像滤波 图像滤波改变像素点的灰度值&#xff0c;不改变像素点的坐标&#xff0c;如下图所示。 用函数可表示为&#xff1a; 其中f(x)表示原图&#xff0c;h(x)表示滤波器 1.2 图像变换 图像变换改…

图像对齐(image alignment)

1、图像对齐的步骤 已知图像A和B&#xff0c;图像对齐的步骤&#xff1a; 提取图像A和B的特征匹配图像A和B中的特征求解图像A和B的对齐矩阵2 使用最小二乘求解对齐矩阵的问题 使用最小二乘求解对齐矩阵容易受到outliers的影响, 误差会很大。 3 RANSAC&#xff08;random sa…

巴黎不哭!十亿点数据“重建”巴黎圣母院

来源&#xff1a;大数据文摘摘要&#xff1a;目前&#xff0c;尽管现实中的大教堂已经无法恢复&#xff0c;但被数字化的“巴黎圣母院”仍然精确地留存在人类世界。而通过这一数据留存&#xff0c;重建巴黎圣母院成为可能&#xff0c;后人也仍然可以一览它曾经的雄伟。即使这一…

照相机的成像变换

1 变换过程 照相机的成像变换过程可以分为3步&#xff1a;世界坐标系——>相机坐标系——>图像坐标系——>像素坐标系 2 世界坐标系——>相机坐标系 景物从世界坐标系转换到相机坐标系需要使用到刚体变换&#xff08;物体不发生变形&#xff0c;对一个几何物体做…

我国芯片各细分领域龙头名单

来源&#xff1a;机械前沿芯片的分类&#xff1a;日常生活中&#xff0c;我们可以发现芯片的种类比如有通信芯片、人工智能芯片、LED芯片、电脑芯片等等。芯片的产业链是这样的&#xff1a;根据产业链划分&#xff0c;芯片从设计到出厂的核心环节主要包括 6 个部分&#xff1a;…

求解相机参数Camera Calibration

1 主要思想 使用黑白棋盘格&#xff0c;记录世界坐标系中关键点的坐标&#xff0c;然后使用手机拍照&#xff0c;记录相应点像素点的坐标。 这样就得到了许多3D-2D的配对点 2 详细过程 由 上一篇博客 内容可知&#xff0c; 其中 P‘ 为像素坐标&#xff0c; Pw为世界坐标系的…

超壮观!10只波士顿动力机器狗,拖动大卡车,步伐整齐划一如同仪仗队

来源&#xff1a;量子位整整10只SpotMini机器狗&#xff0c;可以做什么&#xff1f;波士顿动力的答案是&#xff1a;拉卡车。对&#xff0c;不是狗拉雪橇&#xff0c;是狗拉体积大得多、质量重得多的大卡车。画面中&#xff0c;出现了并排走的一对机器狗。后面还有另一对机器狗…

立体视觉(Stereo Vision)-本征矩阵(essential matrix)和基本矩阵(fundamental matrix)

1 物体深度 问题描述&#xff1a;从不同的位置拍摄相同物体的两张图片&#xff0c;恢复其深度 这里假设摄像机的镜头平行 由相似三角形&#xff1a; 由上面第一、二等式可得&#xff1a; 深度与视差成反比 2 如何配对左右图片的点 问题描述&#xff1a;已知两张图像&#xff…

重磅:苹果高通和解!英特尔退出5G基带市场,高通股价暴涨超20%,华为依然淡定...

来源&#xff1a;新浪、量子位等&#xff0c;物联网智库整理摘要&#xff1a;没有永恒的朋友&#xff0c;只有永恒的利益。前一阵子还是“牛夫人”&#xff0c;今天就变成“小甜甜”了。没有永恒的朋友&#xff0c;只有永恒的利益。前一阵子还是“牛夫人”&#xff0c;今天就变…

计算图像的景深

在 上一篇 博客中&#xff0c;景深与视差成反比&#xff0c;其公式为&#xff1a; 为焦距&#xff0c; 为左右相机的距离&#xff0c;分别为两张图像的点距离各自中心点的距离。 对于左图像的每一个像素点 &#xff0c;求图像景深可以分为以下几步&#xff0c; 在右图中&…

地球是否健康,最新“诊断报告”来了

中国南极中山站附近的冰盖、冰川与冰山。新华社发来源&#xff1a;光明日报4月13日&#xff0c;河北安平&#xff0c;游客在畅游油菜花海。新华社发对地球气候变化的科学诊断&#xff0c;要依赖一些数据指标&#xff1a;全球平均温度、海平面高度、南极冰川厚度等。4月初&#…

Structure from motion 问题

1 问题描述 已知一个图像库&#xff0c;里面有很多从不同角度不同具体拍摄同一物体的照片&#xff0c;求 构建该物体的3D模型找出这些图像的拍照位置 如下图所示&#xff1a; 2 用数学语言描述问题 输入&#xff1a;一批图像&#xff0c;隐含着许多对应点 输出&#xff1a;…