OpenCV书签 #差值哈希算法的原理与相似图片搜索实验

1. 介绍

差值哈希算法(Difference Hash Algorithm,简称dHash) 是哈希算法的一种,主要可以用来做以图搜索/相似图片的搜索工作。

 

2. 原理

差值哈希算法通过计算相邻像素的差异来生成哈希,即通过缩小图像的每个像素与平均灰度值的比较,生成一组哈希值。最后,利用两组图像的哈希值的汉明距离来评估图像的相似度。

 

3. 魔法

概括地讲,差值哈希算法一共可细分五步:

  1. 缩小图像: 调整输入图像的大小为 (hash_size + 1) 宽度和 hash_size 高度,通常为 9x8 像素,总共72个像素。
  2. 图像灰度化: 将彩色图像转换为灰度图像,以便进行灰度差值计算。
  3. 计算差异值: 差值算法工作在相邻像素之间,如果左边的像素比右边的更亮,则记录为1,否则为0,这样每行9个像素通过左右像素的两两比较,会产生8个不同的差异值,一共8行,则会产生64个差异值。
  4. 生成哈希值: 由于64位的二进制值(差异值)太长,所以按每4个字符为1组,由2进制转成16进制。这样就转为一个长度为16的字符串。这个字符串也就是这个图像可识别的哈希值,也叫图像指纹,即这个图像所包含的特征。
  5. 哈希值比较: 通过比较两个图像的哈希值的汉明距离(Hamming Distance),就可以评估图像的相似度,距离越小表示图像越相似。

 

4. 实验

4.1 魔法

第一步:缩小图像

调整输入图像的大小为 (hash_size + 1) 宽度和 hash_size 高度,通常为 9x8 像素,总共72个像素,以便进行后续的差值计算。

1)读取原图

# 测试图片路径
img_path = 'img_test/apple-01.jpg'# 通过OpenCV加载图像
img = cv2.imread(img_path)
plt.imshow(img, cmap='gray')
plt.show()# 通道重排,从BGR转换为RGB
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
plt.imshow(img_rgb, cmap='gray')
plt.show()

dhash-0001

2)缩小原图

# 缩小图像:使用OpenCV的resize函数将图像缩放为9x8像素,采用Cubic插值方法进行图像重采样
img_resize = cv2.resize(img_rgb, (9, 8), cv2.INTER_CUBIC)# 打印 img.shape 可以获取图像的形状信息,即 (行数, 列数, 通道数)
# 通道数:灰度图像通道数为 1,彩色图像通道数为 3
print(img_resize.shape)
plt.imshow(img_resize, cmap='gray')
plt.show()

输出打印:

(8, 9, 3)

dhash-0002
将图像 img 调整大小为 (9, 8) 的尺寸,并使用 cv2.INTER_CUBIC 插值方法进行图像的缩放。在这里,原始图像 img 将被调整为 9 像素宽和 8 像素高。
打印 img.shape 可以获取图像的形状信息,即(行数, 列数, 通道数)。通道数取决于原始图像的通道数(如灰度图像通道数为 1,彩色图像通道数为 3)。

第二步:图像灰度化

将彩色图像转换为灰度图像,以便进行灰度差值计算。

# 图像灰度化:将彩色图像转换为灰度图像。
img_gray = cv2.cvtColor(img_resize, cv2.COLOR_BGR2GRAY)# 打印出了灰度图像的行数和列数,因为灰度图像只有一个通道,所以不会显示通道数
print(img_gray.shape)
plt.imshow(img_gray, cmap='gray')
plt.show()

输出打印:

(8, 9)

dhash-0003
使用 OpenCV 的 cvtColor 函数将彩色图像 img 转换为灰度图像。cv2.COLOR_BGR2GRAY 是颜色空间转换标志,它指示将图像从 BGR(彩色)颜色空间转换为灰度颜色空间。

打印 img_gray.shape 包含图像的维度信息,通常是(行数, 列数)或(行数, 列数, 通道数)。这里只有灰度图像的行数和列数,因为灰度图像只有一个通道,所以不会显示通道数。

第三步:计算差异值

差值算法工作在相邻像素之间,如果左边的像素比右边的更亮,则记录为1,否则为0,这样每行9个像素通过左右像素的两两比较,会产生8个不同的差异值,一共8行,则会产生64个差异值。

# 计算差异值:获得图像二进制字符串
img_hash_str = ''
# img_hash_arr = []
# 遍历图像的像素,比较相邻像素之间的灰度值,根据强弱增减差异情况生成一个二进制哈希值
# 外层循环,遍历图像的行(垂直方向),范围是从0到7
for i in range(8):# 内层循环,遍历图像的列(水平方向),范围也是从0到7for j in range(8):# 比较当前像素 img[i, j] 与下一个像素 img[i, j + 1] 的灰度值if img_gray[i, j] > img_gray[i, j + 1]:# 如果当前像素的灰度值大于下一个像素的灰度值(灰度值增加),将1添加到名为 hash 的列表中# img_hash_arr.append(1)img_hash_str += '1'else:# 否则灰度值弱减,将0添加到名为 hash 的列表中# img_hash_arr.append(0)img_hash_str += '0'
print(f"图像的二进制哈希值={img_hash_str}")

输出打印:

图像的二进制哈希值=0000000000110000001100000010000001110000001000000011000001110000

这段代码的目的是遍历图像的每一行和每一列,逐个比较相邻像素之间的灰度值,根据比较结果生成一个二进制哈希值。如果像素之间的灰度值增加,就将1添加到哈希值中,如果减少或保持不变,就将0添加。这个生成的哈希值可用于图像相似性比较,用于检测图像中的局部特征。

第四步:生成哈希值

由于64位二进制值太长,所以按每4个字符为1组,由2进制转成16进制。这样就转为一个长度为16的字符串。这个字符串也就是这个图像可识别的哈希值,也叫图像指纹,即这个图像所包含的特征。

# 生成哈希值:生成图像可识别哈希值
img_hash = ''
for i in range(0, 64, 4):img_hash += ''.join('%x' % int(img_hash_str[i: i + 4], 2))
print(f"图像可识别的哈希值={img_hash}")

输出打印:

图像可识别的哈希值=0030302070203070

同样的,将目标素材图像进行上述计算,亦可得到一个图像可识别的哈希值。

第五步:哈希值比较

通过两个等长字符串在相同位置上不同字符的数量,计算两个等长字符串之间的汉明距离(Hamming Distance),就可以评估图像的相似度,距离越小表示图像越相似。

# 汉明距离:通过两个等长字符串在相同位置上不同字符的数量,计算两个等长字符串之间的汉明距离
def hamming_distance(s1, s2):# 检查这两个字符串的长度是否相同。如果长度不同,它会引发 ValueError 异常,因为汉明距离只适用于等长的字符串if len(s1) != len(s2):raise ValueError("Input strings must have the same length")distance = 0for i in range(len(s1)):# 遍历两个字符串的每个字符,比较它们在相同位置上的值。如果发现不同的字符,将 distance 的值增加 1if s1[i] != s2[i]:distance += 1return distance

汉明距离: 两个等长字符串在相同位置上不同字符的数量。即一组二进制数据变成另一组数据所需要的步骤数。汉明距离越小,则相似度越高。汉明距离为0,即两张图片完全一样。

dhash-0004

 

4.2 测试

实验场景

通过 opencv,使用差值哈希算法查找目标图像素材库中所有相似图像,并列出相似值。

实验素材

这里,我准备了10张图片,其中9张是苹果,但形态不一;1张梨子。
dhash-0005

实验代码

"""
以图搜图:差值哈希算法(Difference Hash Algorithm,简称dHash)的原理与实现
测试环境:win10 | python 3.9.13 | OpenCV 4.4.0 | numpy 1.21.1
实验场景:通过 opencv,使用差值哈希算法查找目标图像素材库中所有相似图像
实验时间:2023-10-31
实验名称:dhash_v5_all.py
"""import os
import cv2
import timedef get_dHash(img_path):# 读取图像:通过OpenCV的imread加载RGB图像img_rgb = cv2.cvtColor(cv2.imread(img_path), cv2.COLOR_BGR2RGB)# 缩小图像:使用OpenCV的resize函数将图像缩放为9x8像素,采用Cubic插值方法进行图像重采样img_resize = cv2.resize(img_rgb, (9, 8), cv2.INTER_CUBIC)# 图像灰度化:将彩色图像转换为灰度图像img_gray = cv2.cvtColor(img_resize, cv2.COLOR_BGR2GRAY)# 计算差异值:获得图像二进制字符串img_hash_str = ''# 遍历图像的像素,比较相邻像素之间的灰度值,根据强弱增减差异情况生成一个二进制哈希值# 外层循环,遍历图像的行(垂直方向),范围是从0到7for i in range(8):# 内层循环,遍历图像的列(水平方向),范围也是从0到7for j in range(8):# 比较当前像素 img[i, j] 与下一个像素 img[i, j + 1] 的灰度值if img_gray[i, j] > img_gray[i, j + 1]:# 如果当前像素的灰度值大于下一个像素的灰度值(灰度值增加),将1添加到名为 hash 的列表中img_hash_str += '1'else:# 否则灰度值弱减,将0添加到名为 hash 的列表中img_hash_str += '0'# print(f"图像的二进制哈希值={img_hash_str}")# 生成哈希值:生成图像可识别哈希值img_hash = ''.join(map(lambda x:'%x' % int(img_hash_str[x : x + 4], 2), range(0, 64, 4)))return img_hash# 汉明距离:通过两个等长字符串在相同位置上不同字符的数量,计算两个等长字符串之间的汉明距离
def hamming_distance(str1, str2):# 检查这两个字符串的长度是否相同。如果长度不同,它会引发 ValueError 异常,因为汉明距离只适用于等长的字符串if len(str1) != len(str2):raise ValueError("Input strings must have the same length")distance = 0for i in range(len(str1)):# 遍历两个字符串的每个字符,比较它们在相同位置上的值。如果发现不同的字符,将 distance 的值增加 1if str1[i] != str2[i]:distance += 1return distance# ------------------------------------------------- 测试 -------------------------------------------------
if __name__ == "__main__":time_start = time.time()# 指定测试图像库目录img_dir = 'img_test'# 指定测试图像文件扩展名img_suffix = ['.jpg', '.jpeg', '.png', '.bmp', '.gif']# 获取当前执行脚本所在目录script_dir = os.path.dirname(__file__)# 获取目标测试图像的全路径img_org_path = os.path.join(script_dir, img_dir, 'apple-01.jpg')# 获取目标图像可识别哈希值(图像指纹)org_img_hash = get_dHash(img_org_path)print(f"目标图像:{os.path.relpath(img_org_path)},图像HASH:{org_img_hash}")# 获取测试图像库中所有文件all_files = os.listdir(os.path.join(script_dir, img_dir))# 筛选出指定后缀的图像文件img_files = [file for file in all_files if any(file.endswith(suffix) for suffix in img_suffix)]img_hash_all = []# 遍历测试图像库中的每张图像for img_file in img_files:# 获取相似图像文件路径img_path = os.path.join(script_dir, img_dir, img_file)# 获取相似图像可识别哈希值(图像指纹)img_hash = get_dHash(img_path)# 获取相似图像与目标图像的汉明距离distance = hamming_distance(org_img_hash, img_hash)# 存储相似图像的相对路径、哈希值、汉明距离img_hash_all.append((os.path.relpath(img_path), img_hash, distance))for img in img_hash_all:print(f"图像名称:{os.path.basename(img[0])},图像HASH:{img[1]},与目标图像的近似值(汉明距离):{img[2]}")time_end = time.time()print(f"耗时:{time_end - time_start}")

输出打印:

目标图像:..\..\P1_Hash\03_dHash\img_test\apple-01.jpg,图像HASH:0030302070203070
图像名称:apple-01.jpg,图像HASH:0030302070203070,与目标图像的近似值(汉明距离):0
图像名称:apple-02.jpg,图像HASH:2048502430301000,与目标图像的近似值(汉明距离):9
图像名称:apple-03.jpg,图像HASH:0030705070506020,与目标图像的近似值(汉明距离):5
图像名称:apple-04.jpg,图像HASH:3030303038301000,与目标图像的近似值(汉明距离):7
图像名称:apple-05.jpg,图像HASH:0818206840602830,与目标图像的近似值(汉明距离):11
图像名称:apple-06.jpg,图像HASH:00004cccd0c8eeec,与目标图像的近似值(汉明距离):12
图像名称:apple-07.jpg,图像HASH:5af53928b158dc1e,与目标图像的近似值(汉明距离):14
图像名称:apple-08.jpg,图像HASH:87868a060c081e2c,与目标图像的近似值(汉明距离):16
图像名称:apple-09.jpg,图像HASH:0040285060602070,与目标图像的近似值(汉明距离):7
图像名称:pear-001.jpg,图像HASH:0204367274f07060,与目标图像的近似值(汉明距离):10
耗时:0.09773826599121094

 

5. 总结

经过实验和测试,差值哈希算法(dHash)是一种非常简单的算法,易于实现和理解,且计算速度快,适用于大规模图像数据相似性处理。

特点: 传统,属于一种外观相似哈希算法。
优点: 简单、相对准确、计算效率高;在同等测试样本下,相比pHash,dHash的速度要更快;适用于快速图像相似性搜索。
缺点: 对于图像的旋转和缩放敏感,不适用于检测嵌入式水印或复杂的变换,即使是微小的旋转或缩放也会导致哈希值大幅度改变,因为它主要用于检测左右局部像素级别的变化。

 

6. 系列书签

OpenCV书签 #均值哈希算法的原理与相似图片搜索实验
OpenCV书签 #感知哈希算法的原理与相似图片搜索实验
OpenCV书签 #差值哈希算法的原理与相似图片搜索实验

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/640916.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高效构建Java应用:Maven的使用总结

一、Maven简介和快速入门 1.1 Maven介绍 Maven-Introduction Maven 是一款为 Java 项目构建管理、依赖管理的工具(软件),使用 Maven 可以自动化构建、测试、打包和发布项目,大大提高了开发效率和质量。 总结:Maven…

excel(wps)之vlookup函数合并sheet数据

VLOOKUP函数是Excel中的一个纵向查找函数,它与LOOKUP函数和HLOOKUP函数属于一类函数,在工作中都有广泛应用,例如可以用来核对数据,多个表格之间快速导入数据等函数功能。功能是按列查找,最终返回该列所需查询列序所对应…

DEB方式安装elastic search7以及使用

参考:https://www.cnblogs.com/anech/p/15957607.html 1、安装elastic search7 #手动下载安装 wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.17.1-amd64.deb wget https://artifacts.elastic.co/downloads/elasticsearch/elastics…

深度学习(4)--Keras安装

目录 Keras安装: 1.1.安装CUDA/cuDDN工具包 1.1.1.安装前准备 1.1.2.安装CUDA 1.1.3.安装cuDDN 1.2.安装Anaconda 1.3.安装tensorflow框架 1.3.1.使用cmd安装 1.3.2.使用Anaconda Prompt安装 1.4.安装Keras框架 1.5.打开jupyter notebook,执行import调用 Keras…

18.鸿蒙HarmonyOS App(JAVA)日期选择器-时间选择器

18.鸿蒙HarmonyOS App(JAVA)日期选择器-时间选择器 点击button按钮触发事件显示月份与获取的时间 Button button3 (Button) findComponentById(ResourceTable.Id_button3);button3.setClickedListener(new Component.ClickedListener() {Overridepublic void onClick(Compon…

基于springboot酒店预订系统

开发工具:IDEA 服务器:Tomcat9.0, jdk1.8 项目构建:maven 数据库:mysql5.7 前端技术:AdminLTEjQueryvue.jselementuijsp 服务端技术:springbootmybatis 本系统功能包括: 一、…

实验:MySQL 客户端SocketTimeout 抓包分析

实验准备 服务端环境准备 服务器信息 阿里云 99 大洋白嫖机 $ cat /proc/version Linux version 5.15.0-83-generic (builddlcy02-amd64-027) (gcc (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0, GNU ld (GNU Binutils for Ubuntu) 2.38) #92-Ubuntu SMP Mon Aug 14 09:30:42 UT…

特斯拉FSD的神经网络(Tesla 2022 AI Day)

这是特斯拉的全自动驾驶(Full Self Driver)技术结构图,图中把自动驾驶模型拆分出分成了几个依赖的模块: 技术底座:自动标注技术处理大量数据,仿真技术创造图片数据,大数据引擎进不断地更新&…

UML中的实现关系

在UML(统一建模语言)中,“实现”关系是指一个类(实现类)实现一个接口或抽象类的方法的情况。这种关系通常用于指定类如何实现某个特定的接口规范。 UML中的实现关系 在UML类图中,实现关系用一条带有空心箭…

win10 任务栏设置透明

先看效果图 第一步:按下“Win R”组合键,输入“regedit”并回车,打开注册表编辑器。 第二步:在注册表中找到路径“HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Explorer\Advanced”。 第三步:在…

机器人3D视觉引导半导体塑封上下料

半导体塑封上下料是封装工艺中的重要环节,直接影响到产品的质量和性能。而3D视觉引导技术的引入,使得这一过程更加高效、精准。它不仅提升了生产效率,减少了人工操作的误差,还为半导体封装技术的智能化升级奠定了坚实的基础。 传统…

RK3568笔记十一:mpp编解码

若该文为原创文章,转载请注明原文出处。 主要是想测试MPP的解码,为后续做测试。 一、环境 1、平台:rk3568 2、开发板:ATK-RK3568正点原子板子 3、环境:buildroot 二、编译 使用的是正点原子提供的虚拟机,搭建好环…

yolov5 opencv dnn部署自己的模型

yolov5 opencv dnn部署自己的模型 github开源代码地址使用github源码结合自己导出的onnx模型推理自己的视频推理条件c部署c 推理结果 github开源代码地址 yolov5官网还提供的dnn、tensorrt推理链接本人使用的opencv c github代码,代码作者非本人,也是上面作者推荐的…

mysql进阶-执行计划

目录 1. 概念 2. 使用 3. 具体相关字段含义 3.1 id 3.2 select_type 3.3 table 3.4 partition 3.5 type 3.6 possible_key 3.7 key 3.8 key_len 3.9 ref 3.10 row 3.11 filtered 3.12 extra 1. 概念 一条语句通过优化器之后,会生成具体的执行计划用…

HuoCMS|免费开源可商用CMS建站系统HuoCMS 2.0下载(thinkphp内核)

HuoCMS是一套基于ThinkPhp6.0Vue 开发的一套HuoCMS建站系统。 HuoCMS是一套内容管理系统同时也是一套企业官网建设系统,能够帮过用户快速搭建自己的网站。可以满足企业站,外贸站,个人博客等一系列的建站需求。HuoCMS的优势: 可以使用统一后台…

VSCode Python Windows环境下创建虚拟环境,隔离每个项目的依赖pip包,推荐使用!

VSCode Python Windows环境下创建虚拟环境 Visual Studio Code 可以隔离不同项目的pip依赖包,防止不同版本的干扰**(推荐使用)** 先在python官网https://www.python.org/downloads/下载需要的python版本(我选择了3.9.8&#xff09…

JDK8新特性(一)集合之 Stream 流式操作

1.Stream流由来 首先我们应该知道:Stream流的出现,主要是用在集合的操作上。在我们日常的工作中,经常需要对集合中的元素进行相关操作。诸如:增加、删除、获取元素、遍历。 最典型的就是集合遍历了。接下来我们先举个例子来看看 J…

《WebKit 技术内幕》学习之九(2): JavaScript引擎

2 V8引擎 2.1 基础 V8是一个开源项目,也是一个JavaScript引擎的实现。它最开始是由一些语言方面的专家设计出来的,后被Google收购,成为了JavaScript引擎和众多相关技术的引领者。其目的很简单,就是为了提高性能。因为在当时之前…

【学习】focal loss 损失函数

focal loss用于解决正负样本的不均衡情况 通常我们需要预测的正样本要少于负样本,正负样本分布不均衡会带来什么影响?主要是两个方面。 样本不均衡的话,训练是低效不充分的。因为困难的正样本数量较少,大部分时间都在学习没有用…

216. 组合总和 III - 力扣(LeetCode)

题目描述 找出所有相加之和为 n 的 k 个数的组合,且满足下列条件: 只使用数字1到9每个数字 最多使用一次 返回 所有可能的有效组合的列表 。该列表不能包含相同的组合两次,组合可以以任何顺序返回。 输入示例 k 3, n 7输出示例 [[1,2,…