用代码分析图像可能很困难。你如何使代码“理解”图像的上下文?
通常,使用AI分析图像的第一步 是找到主要颜色。在如何使用python中matplotlib库分析图像颜色中,我们将使用matplotlib的 image类在图像中找到主色 。查找主导色也是你可以使用第三方API进行的操作,但是我们将构建自己的系统来执行此操作,以便我们可以完全控制该过程。
我们将首先研究将图像转换为矩阵形式的其组成颜色,然后对它执行k均值聚类以找到主要颜色。
先决条件
如何使用python中matplotlib库分析图像颜色假定你了解Python的基础知识,但你以前无需使用Python处理图像。
如何使用python中matplotlib库分析图像颜色基于以下内容:
1)Python版本3.6.5
2)matplotlib版本2.2.3:解码图像并可视化主色
3)scipy版本1.1.0:执行确定主导颜色的聚类
软件包 matplotlib , scipy 可以通过软件包管理器安装 pip。你可能需要在虚拟环境中安装特定版本的软件包, 以确保与正在处理的其他项目的依赖项没有冲突。
此外,我们将在如何使用python中matplotlib库分析图像颜色中分析JPG图像,仅当你安装其他包装枕头时,该支持才可用。
另外,你也可以只使用Jupyter笔记本。如何使用python中matplotlib库分析图像颜色的代码在Anaconda 1.8.7版的Jupyter笔记本上运行。以上这些程序包已预先安装在Anaconda中。
解码图像
图像可能具有各种扩展名-JPG,PNG,TIFF很常见。这篇文章只关注JPG图片,但是其他图片格式的处理应该不会有太大不同。该过程的第一步是读取图像。
具有JPG扩展名的图像作为点列表(称为像素)存储在内存中。甲 像素,或一个图像元素,表示的图像中的一个点。点的颜色由三个值的组合确定-它的三个分量颜色(红色,蓝色和绿色)。像素的颜色本质上是这三种颜色的组合。
让我们使用下面的图片来查找图像中的主色。你可以在此处下载图像 。
要在Python中读取图像,你需要导入 (documentation)image 类 。 图像类的 方法将图像解码为其RGB值。该方法的输出 是一个尺寸为M x N x 3的数组,其中M和N是图像的尺寸。matplotlibimread()imread()
你可以使用的 类的 imshow() 方法 来显示图像,该图像采用RGB值矩阵的形式。Matplotlib pyplot
我们从该imread() 方法获得的矩阵取决于所读取图像的类型。例如,PNG图像还将包含一个用于测量像素透明度的元素。这篇文章将只涵盖JPG图片。
在继续对图像进行聚类之前,我们需要执行其他步骤。在找出图像的主要颜色的过程中,我们不关心像素的位置。因此,我们需要将M x N x 3矩阵转换为三个单独的列表,其中包含各自的红色,蓝色和绿色值。以下代码段将存储在图像中的矩阵转换为三个单独的列表,每个列表的长度为40,000(200 x 200)。
上面的代码段创建三个空列表,然后通过我们的图像的每个像素循环,附加的RGB值,以我们的 r, g和 b 分别列出。如果正确完成,则每个列表的长度将为40,000(200 x 200)。
集群基础
现在我们已经存储了图像的所有组成色,是时候找到主要颜色了。现在让我们花一点时间来了解聚类的基本知识,以及它如何帮助我们找到图像中的主要色彩。
聚类是一项有助于根据特定属性将相似项目分组在一起的技术。我们将对 上面刚刚创建的三种颜色的列表应用 k均值聚类。
每个聚类中心的颜色将反映聚类所有成员的属性的平均值,这将有助于我们确定图像中的主要颜色。
有几种主要颜色?
在我们对像素数据点执行k均值聚类之前,对并非所有图像都具有相同数量的主色,找出一个给定图像理想的聚类可能对我们来说是一件好事。
由于我们正在处理三个用于聚类的变量-像素的红色,蓝色和绿色值-我们可以在三个维度上可视化这些变量,以了解可能存在多少种主色。
要在中制作3D图 matplotlib,我们将使用 Axes3D() 类(文档)。使用Axes3D() 该类初始化轴后,我们使用该 scatter 方法,并将三个颜色值列表用作参数。
在结果图中,我们可以看到点的分布形成了两个拉长的簇。通过查看它,我们可以看到图像主要由两种颜色组成,这一事实也支持了这一点。因此,在下一节中,我们将重点介绍创建两个群集。
首先,尽管如此,我们可能会猜测3D图可能无法为某些图像生成不同的聚类。另外,如果我们使用的是PNG图像,则将有第四个拼合度(每个像素的透明度值),这将使得无法在三个维度上进行绘制。在这种情况下,你可能需要使用 弯头方法来确定理想的群集数。
在SciPy中执行聚类
在上一步中,我们确定需要两个聚类,现在可以对数据执行k-均值聚类了。让我们创建一个Pandas数据框来轻松管理变量。
使用SciPy进行k均值聚类的过程实质上涉及三个步骤:
1)通过将每个数据点除以其标准偏差来标准化变量。我们将使用该类的 whiten() 方法 vq。
2)使用该kmeans() 方法生成集群中心 。
3)使用类的vq() 方法 为每个数据点生成群集标签 vq。
上面的第一步确保每个变量的变化均等地影响聚类。想象一下两个尺度差异很大的变量。如果我们忽略上面的第一步,那么规模和变化较大的变量将对簇的形成产生更大的影响,从而使过程产生偏差。如何使用python中matplotlib库分析图像颜色因此,我们使用whiten() 函数将变量标准化 。该 whiten() 函数采用一个参数,变量值的列表或数组,然后返回标准化值。标准化后,我们将打印数据框的样本。请注意,标准化列中列的变化已大大减少。
下一步是使用标准化列执行k均值聚类。我们将使用kmeans() 执行聚类的 功能。的 kmeans() 功能(文档)具有两个参数-的意见和簇的数目。它返回两个值-聚类中心和变形。失真是每个点与其最近的群集中心之间的距离平方的总和。在如何使用python中matplotlib库分析图像颜色中,我们不会使用失真。
k均值聚类的最后一步是生成聚类标签。但是,在本练习中,我们不需要这样做。我们仅在寻找由聚类中心表示的主色。
显示主要颜色
我们已经执行了k均值聚类并生成了聚类中心,所以让我们看看它们包含哪些值。
如你所见,我们得到的结果是 RGB值的标准化版本。为了获得原始颜色值,我们需要将它们与标准偏差相乘。
我们将使用的 类imshow() 方法 以调色板的形式显示颜色。但是,要显示颜色, 需要RGB值在0到1的范围内,其中1表示我们原始RGB值比例中的255。因此,我们必须将群集中心的每个RGB分量除以255,以获得0到1之间的值,并通过该方法显示它们 。matplotlibpyplotimshow()imshow()
最后,在使用imshow()函数(文档)绘制颜色之前,我们还要多加考虑 。聚类中心的尺寸为N x 3,其中N是聚类数。 imshow() 最初旨在显示颜色的AXB矩阵,因此需要3D尺寸为A x B x 3的数组(调色板中每个块包含三个颜色元素)。因此,我们需要通过将聚类中心的颜色作为单个元素的列表传递,将N x 3矩阵转换为1 x N x 3矩阵。例如,如果我们将颜色存储在其中, colors 则需要[colors] 作为参数传递 给 imshow()。
让我们探索图像中的主要色彩。
不出所料,图像中看到的颜色与我们开始使用的图像中的突出颜色非常相似。也就是说,你可能已经注意到上面的浅蓝色实际上并未出现在我们的源图像中。请记住,聚类中心是每个聚类中所有像素的所有RGB值的均值。因此,最终的聚类中心实际上可能不是原始图像中的颜色,而只是RBG值位于聚类中心,即图像中所有看起来相似的像素。
结论
在如何使用python中matplotlib库分析图像颜色中,我们逐步研究了如何使用matplotlib 和查找Python中图像的主色 scipy。我们从JPG图像开始,然后使用imread() 中的图像类方法 将其转换为RGB值 matplotlib。然后,我们使用进行k均值聚类, scipy 以找到主要颜色。最后,我们使用imshow()中的pyplot 类 方法 显示了主色 matplotlib。
相关推荐
IT互联网职业培训:大数据分析R语言RStudio使用教程zhuanlan.zhihu.comIT互联网职业培训:如何申请创建数据分析项目组合zhuanlan.zhihu.comIT互联网职业培训:大数据分析R中泊松回归模型实例zhuanlan.zhihu.comIT互联网职业培训:原画概念设计环境光遮蔽AO贴图使用技巧zhuanlan.zhihu.com