感知哈希算法原理与实现

今天忽然想做一个图像识别的APP,但是在两张图片相似度的问题上产生了问题,感知哈希算法并不能解决这个问题,只是我在试着解决问题的过程中学到的一点知识。

这里的关键技术叫做”感知哈希算法”(Perceptual hash algorithm),它的作用是对每张图片生成一个”指纹”(fingerprint)字符串,然后比较不同图片的指纹。结果越接近,就说明图片越相似。

下面是一个最简单的实现:

  1. 第一步,缩小尺寸。
    将图片缩小到8x8的尺寸,总共64个像素。这一步的作用是去除图片的细节,只保留结构、明暗等基本信息,摒弃不同尺寸、比例带来的图片差异。

  2. 第二步,简化色彩。
    将缩小后的图片,转为64级灰度。也就是说,所有像素点总共只有64种颜色。

  3. 第三步,计算平均值。
    计算所有64个像素的灰度平均值。

  4. 第四步,比较像素的灰度。
    将每个像素的灰度,与平均值进行比较。大于或等于平均值,记为1;小于平均值,记为0。

  5. 第五步,计算哈希值。
    将上一步的比较结果,组合在一起,就构成了一个64位的整数,这就是这张图片的指纹。组合的次序并不重要,只要保证所有图片都采用同样次序就行了。

得到指纹以后,就可以对比不同的图片,看看64位中有多少位是不一样的。在理论上,这等同于计算”汉明距离”(Hamming distance)。如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。

这种算法的优点是简单快速,不受图片大小缩放的影响,缺点是图片的内容不能变更。如果在图片上加几个文字,它就认不出来了。所以,它的最佳用途是根据缩略图,找出原图。

实际应用中,往往采用更强大的pHash算法和SIFT算法,它们能够识别图片的变形。只要变形程度不超过25%,它们就能匹配原图。这些算法虽然更复杂,但是原理与上面的简便算法是一样的,就是先将图片转化成Hash字符串,然后再进行比较。

具体实现

工具类

/*** 图片工具类,主要针对图片水印处理* * @author WANGHONG* */
public class ImageHelper {// 项目根目录路径public static final String path = System.getProperty("user.dir");/*** 生成缩略图 <br/>* 保存:ImageIO.write(BufferedImage, imgType[jpg/png/...], File);* * @param source*            原图片* @param width*            缩略图宽* @param height*            缩略图高* @param b*            是否等比缩放* */public static BufferedImage thumb(BufferedImage source, int width, int height, boolean b) {// targetW,targetH分别表示目标长和宽int type = source.getType();BufferedImage target = null;double sx = (double) width / source.getWidth();double sy = (double) height / source.getHeight();if (b) {if (sx > sy) {sx = sy;width = (int) (sx * source.getWidth());} else {sy = sx;height = (int) (sy * source.getHeight());}}if (type == BufferedImage.TYPE_CUSTOM) { // handmadeColorModel cm = source.getColorModel();WritableRaster raster = cm.createCompatibleWritableRaster(width, height);boolean alphaPremultiplied = cm.isAlphaPremultiplied();target = new BufferedImage(cm, raster, alphaPremultiplied, null);} elsetarget = new BufferedImage(width, height, type);Graphics2D g = target.createGraphics();// smoother than exlax:g.setRenderingHint(RenderingHints.KEY_RENDERING, RenderingHints.VALUE_RENDER_QUALITY);g.drawRenderedImage(source, AffineTransform.getScaleInstance(sx, sy));g.dispose();return target;}/*** 图片水印* * @param imgPath*            待处理图片* @param markPath*            水印图片* @param x*            水印位于图片左上角的 x 坐标值* @param y*            水印位于图片左上角的 y 坐标值* @param alpha*            水印透明度 0.1f ~ 1.0f* */public static void waterMark(String imgPath, String markPath, int x, int y, float alpha) {try {// 加载待处理图片文件Image img = ImageIO.read(new File(imgPath));BufferedImage image = new BufferedImage(img.getWidth(null), img.getHeight(null), BufferedImage.TYPE_INT_RGB);Graphics2D g = image.createGraphics();g.drawImage(img, 0, 0, null);// 加载水印图片文件Image src_biao = ImageIO.read(new File(markPath));g.setComposite(AlphaComposite.getInstance(AlphaComposite.SRC_ATOP, alpha));g.drawImage(src_biao, x, y, null);g.dispose();// 保存处理后的文件FileOutputStream out = new FileOutputStream(imgPath);JPEGImageEncoder encoder = JPEGCodec.createJPEGEncoder(out);encoder.encode(image);out.close();} catch (Exception e) {e.printStackTrace();}}/*** 文字水印* * @param imgPath*            待处理图片* @param text*            水印文字* @param font*            水印字体信息* @param color*            水印字体颜色* @param x*            水印位于图片左上角的 x 坐标值* @param y*            水印位于图片左上角的 y 坐标值* @param alpha*            水印透明度 0.1f ~ 1.0f*/public static void textMark(String imgPath, String text, Font font, Color color, int x, int y, float alpha) {try {Font Dfont = (font == null) ? new Font("宋体", 20, 13) : font;Image img = ImageIO.read(new File(imgPath));BufferedImage image = new BufferedImage(img.getWidth(null), img.getHeight(null), BufferedImage.TYPE_INT_RGB);Graphics2D g = image.createGraphics();g.drawImage(img, 0, 0, null);g.setColor(color);g.setFont(Dfont);g.setComposite(AlphaComposite.getInstance(AlphaComposite.SRC_ATOP, alpha));g.drawString(text, x, y);g.dispose();FileOutputStream out = new FileOutputStream(imgPath);JPEGImageEncoder encoder = JPEGCodec.createJPEGEncoder(out);encoder.encode(image);out.close();} catch (Exception e) {System.out.println(e);}}/*** 读取JPEG图片* * @param filename*            文件名* @return BufferedImage 图片对象*/public static BufferedImage readJPEGImage(String filename) {try {InputStream imageIn = new FileInputStream(new File(filename));// 得到输入的编码器,将文件流进行jpg格式编码JPEGImageDecoder decoder = JPEGCodec.createJPEGDecoder(imageIn);// 得到编码后的图片对象BufferedImage sourceImage = decoder.decodeAsBufferedImage();return sourceImage;} catch (FileNotFoundException e) {e.printStackTrace();} catch (ImageFormatException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();}return null;}/*** 读取JPEG图片* * @param filename*            文件名* @return BufferedImage 图片对象*/public static BufferedImage readPNGImage(String filename) {try {File inputFile = new File(filename);BufferedImage sourceImage = ImageIO.read(inputFile);return sourceImage;} catch (FileNotFoundException e) {e.printStackTrace();} catch (ImageFormatException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();}return null;}/*** 灰度值计算* * @param pixels*            像素* @return int 灰度值*/public static int rgbToGray(int pixels) {// int _alpha = (pixels >> 24) & 0xFF;int _red = (pixels >> 16) & 0xFF;int _green = (pixels >> 8) & 0xFF;int _blue = (pixels) & 0xFF;return (int) (0.3 * _red + 0.59 * _green + 0.11 * _blue);}/*** 计算数组的平均值* * @param pixels*            数组* @return int 平均值*/public static int average(int[] pixels) {float m = 0;for (int i = 0; i < pixels.length; ++i) {m += pixels[i];}m = m / pixels.length;return (int) m;}
}

程序入口

package com.test.image;import java.awt.image.BufferedImage;
import java.util.ArrayList;
import java.util.List;public class ImageSearch {/*** @param args*/public static void main(String[] args) {List<String> hashCodes = new ArrayList<String>();String filename = ImageHelper.path + "\\images\\";String hashCode = null;for (int i = 0; i < 6; i++) {hashCode = produceFingerPrint(filename + "example" + (i + 1) + ".jpg");hashCodes.add(hashCode);}System.out.println("Resources: ");System.out.println(hashCodes);System.out.println();String sourceHashCode = produceFingerPrint(filename + "source.jpg");System.out.println("Source: ");System.out.println(sourceHashCode);System.out.println();for (int i = 0; i < hashCodes.size(); i++) {int difference = hammingDistance(sourceHashCode, hashCodes.get(i));if (difference == 0) {System.out.print("source.jpg图片跟example" + (i + 1) + ".jpg一样");} else if (difference <= 5) {System.out.print("source.jpg图片跟example" + (i + 1) + ".jpg非常相似");} else if (difference <= 10) {System.out.print("source.jpg图片跟example" + (i + 1) + ".jpg有点相似");} else if (difference > 10) {System.out.print("source.jpg图片跟example" + (i + 1) + ".jpg完全不一样");}System.out.println("\t汉明距离\t" + difference);}}/*** 计算"汉明距离"(Hamming distance)。 如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。* * @param sourceHashCode*            源hashCode* @param hashCode*            与之比较的hashCode*/public static int hammingDistance(String sourceHashCode, String hashCode) {int difference = 0;int len = sourceHashCode.length();for (int i = 0; i < len; i++) {if (sourceHashCode.charAt(i) != hashCode.charAt(i)) {difference++;}}return difference;}/*** 生成图片指纹* * @param filename*            文件名* @return 图片指纹*/public static String produceFingerPrint(String filename) {BufferedImage source = ImageHelper.readPNGImage(filename);// 读取文件int width = 8;int height = 8;// 第一步,缩小尺寸。// 将图片缩小到8x8的尺寸,总共64个像素。这一步的作用是去除图片的细节,只保留结构、明暗等基本信息,摒弃不同尺寸、比例带来的图片差异。BufferedImage thumb = ImageHelper.thumb(source, width, height, false);// 第二步,简化色彩。// 将缩小后的图片,转为64级灰度。也就是说,所有像素点总共只有64种颜色。int[] pixels = new int[width * height];for (int i = 0; i < width; i++) {for (int j = 0; j < height; j++) {pixels[i * height + j] = ImageHelper.rgbToGray(thumb.getRGB(i, j));}}// 第三步,计算平均值。// 计算所有64个像素的灰度平均值。int avgPixel = ImageHelper.average(pixels);// 第四步,比较像素的灰度。// 将每个像素的灰度,与平均值进行比较。大于或等于平均值,记为1;小于平均值,记为0。int[] comps = new int[width * height];for (int i = 0; i < comps.length; i++) {if (pixels[i] >= avgPixel) {comps[i] = 1;} else {comps[i] = 0;}}// 第五步,计算哈希值。// 将上一步的比较结果,组合在一起,就构成了一个64位的整数,这就是这张图片的指纹。组合的次序并不重要,只要保证所有图片都采用同样次序就行了。StringBuffer hashCode = new StringBuffer();for (int i = 0; i < comps.length; i += 4) {int result = comps[i] * (int) Math.pow(2, 3) + comps[i + 1] * (int) Math.pow(2, 2) + comps[i + 2] * (int) Math.pow(2, 1) + comps[i + 2];hashCode.append(binaryToHex(result));}// 得到指纹以后,就可以对比不同的图片,看看64位中有多少位是不一样的。return hashCode.toString();}/*** 二进制转为十六进制* * @param int binary* @return char hex*/private static char binaryToHex(int binary) {char ch = ' ';switch (binary) {case 0:ch = '0';break;case 1:ch = '1';break;case 2:ch = '2';break;case 3:ch = '3';break;case 4:ch = '4';break;case 5:ch = '5';break;case 6:ch = '6';break;case 7:ch = '7';break;case 8:ch = '8';break;case 9:ch = '9';break;case 10:ch = 'a';break;case 11:ch = 'b';break;case 12:ch = 'c';break;case 13:ch = 'd';break;case 14:ch = 'e';break;case 15:ch = 'f';break;default:ch = ' ';}return ch;}
}

完成,但要实现同一个物体两张图片的内容识别出来并判断相似度的道路还是很远啊,哪种算法可以实现这种功能,我还不知道,有知道的同学可以在评论区告诉我一声,多谢。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/494383.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android开发中目前流行控件和知识点总结

1、SlidingMenu 滑动菜单 应用案例&#xff1a;Facebook 、 Path 2.0 、人人、网易新闻 下载地址&#xff1a; https://github.com/jfeinstein10/SlidingMenu 2、PullToRefresh 下拉刷新 应用案例&#xff1a;新浪微博 等等 &#xff0c;这个很长用哦&#xff01; 下载地址&…

李德毅:“反用驾驶脑”测认知能力,谁说酒驾一定违规?

来源&#xff1a;德先生摘要&#xff1a;从2016年阿尔法狗成功挑战人类智慧的这场世纪大战开始&#xff0c;“人工智能”便引发了全世界的关注。从2016年阿尔法狗成功挑战人类智慧的这场世纪大战开始&#xff0c;“人工智能”便引发了全世界的关注。为了让中国在人工智能这场“…

【每日SQL打卡】​​​​​​​​​​​​​​​DAY 18丨即时食物配送 II【难度中等】​

【未来的你&#xff0c;会感谢今天努力的你】每日两题&#xff0c;一难一易&#xff0c;每天进步一点点&#xff0c;可能会直接导致一场面试的成功&#xff0c;或工作的轻松搞定&#xff0c;从而升职加薪迎娶白富美&#xff0c;加油小伙伴&#xff01; &#x1f345;举办场地&a…

[zz]4.1.5 进程的处理器亲和性和vCPU的绑定

转载自&#xff1a;http://smilejay.com/2012/08/kvm-vcpu-binding/ 通常情况下&#xff0c;在SMP系统中&#xff0c;Linux内核的进程调度器根据自有的调度策略将系统中的一个进程调度到某个CPU上执行。一个进程在前一个执行时间 是在cpuM&#xff08;M为系统中的某CPU的ID&…

谷歌无人车十年记:理想背后的骨感现实 | 厚势汽车

来源&#xff1a;The Information编译&#xff1a;厚势摘要&#xff1a;即使是近 10 年后&#xff0c;Waymo 仍远没有实现真正的 L4&#xff0c;即使是在相对简单的郊区环境下。「全自动驾驶的汽车来了&#xff01;」去年 11 月&#xff0c;Waymo 搞了一个大新闻。公司宣布自己…

【每日SQL打卡】​​​​​​​​​​​​​​​DAY 19丨行转列【难度中等】​

【未来的你&#xff0c;会感谢今天努力的你】每日两题&#xff0c;一难一易&#xff0c;每天进步一点点&#xff0c;可能会直接导致一场面试的成功&#xff0c;或工作的轻松搞定&#xff0c;从而升职加薪迎娶白富美&#xff0c;加油小伙伴&#xff01; &#x1f345;举办场地&a…

自定义控件之瀑布流与水波纹实现

本文主要讲述了利用android自定义控件实现瀑布流与水波纹效果 首先为实现效果&#xff0c;应了解touch事件在android中的传递机制 在执行touch事件时 首先执行dispatchTouchEvent方法&#xff0c;执行事件分发。 再执行onInterceptTouchEvent方法&#xff0c;判断是否中断事件…

医学信息学相关术语、缩语及专业名词

医学信息学相关术语、缩语及专业名词 很棒哦&#xff0c;分享了&#xff0c;需要的可以去瞅瞅http://www.med-informatics.cn/MedInfo_gloss/medinfo_gloss_p1.htm如果你到它的完整上再逛逛&#xff0c;发觉还有很多好资源&#xff0c;譬如&#xff1a;http://www.med-informat…

【每日SQL打卡】​​​​​​​​​​​​​​​DAY 19丨最后一个能进入电梯的人【难度中等】​

【未来的你&#xff0c;会感谢今天努力的你】每日两题&#xff0c;一难一易&#xff0c;每天进步一点点&#xff0c;可能会直接导致一场面试的成功&#xff0c;或工作的轻松搞定&#xff0c;从而升职加薪迎娶白富美&#xff0c;加油小伙伴&#xff01; &#x1f345;举办场地&a…

神经网络并不是尚方宝剑,我们需要正视深度 NLP 模型的泛化问题

来源&#xff1a;AI 科技评论前段时间的文章《顶会见闻系列&#xff1a;ACL 2018&#xff0c;在更具挑战的环境下理解数据表征及方法评价》中&#xff0c;我们介绍了 ACL 大会上展现出的 NLP 领域的最新研究风向和值得关注的新进展。从这些新动向上我们似乎应该对深度学习 NLP …

Android之XML序列化和解析

XML文件是一种常用的文件格式&#xff0c;可以用来存储与传递数据 &#xff0c;本文是XML文件序列化与解析的一个简单示例 写文件到本地&#xff0c;并用XML格式存储 /*** 写xml文件到本地*/private void writeXmlToLocal() {List<Person> personList getPersonList()…

北京智控美信(长春)数据中心应聘总结

时间&#xff1a; 2012年9月12日 公司介绍&#xff1a; IT外包公司&#xff0c;提供咨询——开发——维护的整套服务。涉及金融、石油、电力等行业。 代表性项目&#xff1a; 吉林银行的先进性系统。 简历投递&#xff1a; 发送到邮箱&#xff1a;kd.hrinfohold.com.cn (注明应…

信息技术智库丨月度大考试

【未来的你&#xff0c;会感谢今天努力的你】每日两题&#xff0c;一难一易&#xff0c;每天进步一点点&#xff0c;可能会直接导致一场面试的成功&#xff0c;或工作的轻松搞定&#xff0c;从而升职加薪迎娶白富美&#xff0c;加油小伙伴&#xff01; &#x1f345;举办场地&a…

Android之查看网络图片和网页HTML

网络编程是Android应用中很重要的一部分&#xff0c;本文主要讲述了利用HttpURLConnection获取网络图片和HTML的方法。 获取网络图片 public class MainActivity extends Activity implements OnClickListener {private static final String TAG "MainActivity";p…

【每日SQL打卡】​​​​​​​​​​​​​​​DAY 20丨查询球队积分【难度中等】​

【未来的你&#xff0c;会感谢今天努力的你】每日两题&#xff0c;一难一易&#xff0c;每天进步一点点&#xff0c;可能会直接导致一场面试的成功&#xff0c;或工作的轻松搞定&#xff0c;从而升职加薪迎娶白富美&#xff0c;加油小伙伴&#xff01; &#x1f345;举办场地&a…

来博客园开了个博客

平时搜索资料也经常搜到博客园的文章&#xff0c;我一看&#xff0c;支持代码高亮&#xff0c;就注册了&#xff0c;也开了个。 以前辗转好多个博客&#xff0c;都没坚持&#xff0c;后来都废弃了。转载于:https://www.cnblogs.com/dyllen/archive/2013/01/31/2887383.html

智能交通大数据及云应用平台解决方案

来源&#xff1a;网络大数据摘要&#xff1a;随着日益增长的交通“大数据”&#xff0c;给交通管理创新带来的新挑战&#xff0c;以及对交通管理工作提出的新要求&#xff0c;交通信息化建设必然步入云计算智慧应用阶段&#xff0c;利用云计算破解当前诸多交通瓶颈问题。什么是…

【每日SQL打卡】​​​​​​​​​​​​​​​DAY 20丨查询结果的质量和占比【难度简单】​

【未来的你&#xff0c;会感谢今天努力的你】每日两题&#xff0c;一难一易&#xff0c;每天进步一点点&#xff0c;可能会直接导致一场面试的成功&#xff0c;或工作的轻松搞定&#xff0c;从而升职加薪迎娶白富美&#xff0c;加油小伙伴&#xff01; &#x1f345;举办场地&a…

Android之网络编程

本文主要包括三方面内容 Httpurlconnection中doGet与doPost方法实现提交数据到服务器HttpClient中doGet与doPost方法实现提交数据到服务器android-async-http开源库方法实现提交数据到服务器 首先是服务器端的实现 public class LoginServlet extends HttpServlet {/*** Th…

【每日SQL打卡】​​​​​​​​​​​​​​​DAY 21丨每个帖子的评论数【难度中等】​

【未来的你&#xff0c;会感谢今天努力的你】每日两题&#xff0c;一难一易&#xff0c;每天进步一点点&#xff0c;可能会直接导致一场面试的成功&#xff0c;或工作的轻松搞定&#xff0c;从而升职加薪迎娶白富美&#xff0c;加油小伙伴&#xff01; &#x1f345;举办场地&a…