图片双线性插值原理解析与代码 Python

一、原理解析

图片插值是图片操作中最常用的操作之一。为了详细解析其原理,本文以 3×3 图片插值到 5×5 图片为例进行解析。如上图左边蓝色方框是 5×5 的目标图片,右边红色方框是 3×3 的源图片。上图中,蓝/红色方框是图片,图片中的蓝/红色小圆点是图片中的像素,蓝/红色实线箭头是图片坐标系,蓝/红色虚线箭头是图片像素坐标系,从中可以发现图片框是要比最外圈像素所围成的像素框大一圈。图片插值指的是将右边红色方框放大到与左边蓝色方框同大,然后通过右边放大后的 3×3 的红色像素值计算得到左边的 5×5 的蓝色像素值。通常意义下所说的图片缩放或插值指的是两幅图片的图片框之间的关系而不是像素框之间的关系。基于图片框缩放,3×3 的图片要插值搭到 5×5 的图片,指的是红色方框从上图放大到下图的样子。

如果采用像素框缩放,那红色方框放大后,需要保证 3×3 的像素的四个角的像素位置与蓝色方框的 5×5 像素的四个角的像素位置完全重合,那放大后的红色方框要比上图的红色方框再大一小圈。基于图片框缩放,从上图中可以发现,当 3×3 的红色图片被插值到 5×5 的图片后,原本 3×3 的像素位置也会相应的发生缩放。

将参考辅助线调整后,如上左图所示,在完成缩放后,那图片插值的剩余过程就是通过红色像素值计算蓝色像素值。拿一个最左下角红色方格举例如上右图所示,已知四个红色像素点的位置和像素值,同样已知蓝色像素点 P 的位置,求 P 的像素值。

二维线性插值是图片插值中最常用的插值算法。二维线性插值的原理为,首先基于一维线性插值原理,通过 Q_{11} 和 Q_{12} 计算得到 R_{1} 的像素值,通过 Q_{21} 和 Q_{22} 计算得到 R_{2} 的像素值,然后通过 R_{1} 和 R_{2} 计算得到 P 的像素值。

通过 Q_{11} 和 Q_{12} 计算得到 R_{1} 的像素值的公式为(线性方程):

R_{1} = \frac{x_{p}-x_{2}}{x_{1}-x_{2}}Q_{11}+\frac{x_{1}-x_{p}}{x_{1}-x_{2}}Q_{12}

通过 Q_{21} 和 Q_{22} 计算得到 R_{2} 的像素值的公式为(线性方程):

R_{2} = \frac{x_{p}-x_{2}}{x_{1}-x_{2}}Q_{21}+\frac{x_{1}-x_{p}}{x_{1}-x_{2}}Q_{22}

通过 R_{1} 和 R_{2} 计算得到 P 的像素值的公式为(线性方程):

P = \frac{y_{p}-y_{2}}{y_{1}-y_{2}}R_{1}+\frac{y_{1}-y_{p}}{y_{1}-y_{2}}R_{2}

整理得到:

P = (1-u)(1-v)Q_{11} + (1-u)vQ_{12} + u(1-v)Q_{21} + uvQ_{22}

其中

u = x_{p} - x_{1}, v = y_{p} - y_{1}

这里需要特别说明的是,边界点的处理方法,如上右图的 S 点,其位于四个红色像素点以外,但由于其位于图片的最左下角边界上,其下面没有红色像素点,只有上面有两个像素点。但针对 S 点像素值的计算我们依然使用这四个红色像素点,相当于 S 点是 R_{1} 与 R_{2} 的直线段的延伸。

二、Python 代码

关于代码实现需要注意 3 个地方:

1. 上面原理讲的是从原图片像素坐标映射到目标图片像素坐标的过程,但实际编程一般采用从目标图片像素坐标映射到源图片像素坐标;

2. 在缩放比计算时注意,图片框缩放计算公式是 src_h/dst_h,但像素框缩放计算公式是 (src_h-1)/(dst_h-1);

3. 在图片边界处的处理为,需要保证所计算的左下角像素点坐标大于等于 0 且小于等于图片尺寸 -2,小于等于图片尺寸 -2 的原因是保证右上角像素点坐标小于等于图片尺寸 -1,边界处的像素点的计算依然需要最近邻的四个点。

import numpy as np
import cv2def bilinear(src_img, dst_shape):# 计算目标图片到原图片的缩放比,且是图片坐标系的缩放,不是像素坐标系的缩放,像素位于图像像素格的中心src_h, src_w = src_img.shape[0], src_img.shape[1]dst_h, dst_w = dst_shapescale_h, scale_w = src_h/dst_h, src_w/dst_w              # 如果是像素坐标系的缩放则应该为 (src_h-1)/(dst_h-1)# 定义目标图片并向其中填充像素值,遍历目标图片像中的每个像素点dst_img = np.zeros((dst_h, dst_w, 3), np.uint8)for i in range(dst_h):for j in range(dst_w):# 将 目标像素坐标系下的坐标 --> 目标图像坐标系下的坐标(+0.5) --> 源图像坐标系下的坐标(*scale) --> 源像素坐标系下的坐标(-0.5)src_x = (j + 0.5) * scale_w - 0.5src_y = (i + 0.5) * scale_h - 0.5# 在非边界情况下获取左下角图像像素点坐标,在左/下边界的情况下保证大于等于0,在右/上边界的情况下保证小于等于src-2,以保证计算时所用的右上角像素坐标小于等于src-1src_x_int = min(max(int(src_x), 0), src_w-2)src_y_int = min(max(int(src_y), 0), src_h-2)# 获取所求像素点相比左下角像素点的距离src_x_float = src_x - src_x_intsrc_y_float = src_y - src_y_int# 计算每个像素值dst_img[i, j, :] = (1. - src_y_float) * (1. - src_x_float) * src_img[src_y_int, src_x_int, :] + \(1. - src_y_float) * src_x_float * src_img[src_y_int, src_x_int + 1, :] + \src_y_float * (1. - src_x_float) * src_img[src_y_int + 1, src_x_int, :] + \src_y_float * src_x_float * src_img[src_y_int + 1, src_x_int + 1, :]return dst_imgif __name__ == "__main__":img_path = "test.jpg"src_img = cv2.imread(img_path, cv2.IMREAD_COLOR)dst_shape = (300, 400)# 图片放缩均采用双线性插值法# opencv的放缩图片函数resize_image = cv2.resize(src_img, (400, 300), interpolation=cv2.INTER_LINEAR)# 自定义的图片放缩函数dst_img = bilinear(src_img, dst_shape)cv2.imwrite("new_resize.jpg", resize_image)cv2.imwrite("new.jpg", dst_img)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/614064.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

行为型模式 | 观察者模式

一、观察者模式 1、原理 观察者模式又叫做发布-订阅(Publish/Subscribe)模式,定义了一种一对多的依赖关系。让多个观察者对象同时监听某一个主题对象,这个主题对象在状态上发生变化时,会通知所有观察者对象&#xff0…

容灾演练双月报|DRCC助力中韩人寿完成核心系统年度演练任务

了解更多灾备行业动态 守护数字化时代业务连续 目录 CONTENTS 01 灾备法规政策 02 热点安全事件 03 容灾演练典型案例 01 灾备法规政策 2023年12月,工信部和国标委联合发布《工业领域数据安全标准体系建设指南(2023版)》&#xff0…

兔子目标检测数据集VOC格式340张

兔子,一种温顺而可爱的哺乳动物,以其独特的形态和特点而受到人们的喜爱。 兔子的体型小巧,通常呈圆锥形,有着柔软的毛发和圆溜溜的眼睛。它们的耳朵长而直立,能够听到细微的声音。兔子的前肢较短,后肢较长…

2023年中国产业格局巨变:电子行业崛起、新能源汽车崭露头角,500强企业大揭秘!

随着2023年的收官,最新中国公司500强市值排行榜也火热出炉。受地缘政治、全球经济下行等影响,本次榜单发生明显变化。台积电超越腾讯控股排名第一,共有76家新面孔跻身500强。具体来看,这些“明星企业”都集中在哪些行业&#xff1…

基于知识图谱的健康知识问答系统

基于知识图谱的健康知识问答系统 引言数据集与技术选型数据集技术选型 系统功能与实现数据导入与图数据库构建问答任务设计与实现1. 实体提取2. 用户意图识别 前端聊天界面与问答系统 结语 引言 随着互联网的发展,人们对健康知识的需求逐渐增加。为了更方便地获取健…

模型评估:余弦距离的应用

其实在模型训练过程中,我们在不断地评估着样本间的距离,如何评估样本距离也是定义优化目标和训练方法的基础。 在机器学习问题中,通常将特征表示为向量的形式,所以在分析两个特征向量之间的相似性时,常使用余弦相似度…

Demo: 给图片添加自定义水印并下载

给图片添加自定义水印并下载 <template><div class"wrap"><div class"optea"><div class"file-upload"><p>选择图片</p><el-button type"text" style"color: #c00;"><label f…

微信小程序swiper实现层叠轮播图

在微信小程序中,需要实现展示5个&#xff0c;横向层叠的轮播图效果&#xff0c;轮播图由中间到2侧的依次缩小.如下图 使用原生小程序进行开发,没有使用Skyline模式&#xff0c;所以layout-type配置项也无效。所以基于swiper组件进行调整。 主要思路就是设置不同的样式&#xff…

sdbusplus:method同步调用通用函数

dbus的method操作的方式也比较类似,可以尝试封装成通用函数: //dbus_call.hpp #pragma once#include <utility> #include <boost/asio.hpp> #include <sdbusplus/asio/connection.hpp> #include <sdbusplus/bus.hpp> #include <sdbusplus/messag…

android启动流程

BootROM 这个固化在rom里 Bootloader 启动kernel前的准备工作&#xff0c;包括正常启动与recovery&#xff0c;烧写等不同做出判断 启动kernel会传些参数 重点是android启动流程 1. 驱动加载 比如usb, light, audio, camera, bt, wifi等 2. init 见system/core/init/init.c…

操作系统 进程相关

1 进程、线程、协程 定义 【Are u OKay&#xff1f;——协程、线程、进程】 https://www.bilibili.com/video/BV1Wr4y1A7DS/?share_sourcecopy_web&vd_source1e4d767755c593476743c8e4f64e18db 高并发&#xff1a;线程池&#xff0c;不要无休止的创建线程。--> task…

一起学习python类的属性装饰器@property

之前文章我们介绍了class的一些通用功能&#xff0c;比如类属性/类方法/实例属性/实例方法等&#xff0c;之前的属性可以直接修改和访问&#xff08;设置私有属性&#xff0c;不能直接访问,可通过对象名._[类名][属性名]的方式访问&#xff09;&#xff0c;没有一些权限的控制逻…

java--科星互联ID刷卡器TTS语音版,UDP协议实现语音播报

import java.io.IOException; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.InetAddress; public class UdpVoiceSender { private static final String IP_ADDRESS "192.168.1.100"; // 刷卡器IP地址 private stati…

计算机速成课Crash Course - 18. 操作系统

今天继续计算机速成课Crash Course的系列讲解。 更多技术文章&#xff0c;全网首发公众号 “摸鱼IT” 锁定 -上午11点 - &#xff0c;感谢大家关注、转发、点赞&#xff01; 计算机速成课Crash Course - 17. 集成电路&摩尔定律 18. 操作系统 1940,1950 年代的电脑&#…

常用机床类型的用途和介绍

随着市场对机加工需求的提升&#xff0c;机械加工的技术精度也随之提高&#xff0c;机床的种类也就越来越多。 根据加工方法和使用的工具进行分类&#xff0c;国家将机床编制为11类&#xff1a;车床、钻床、镗床、磨床、齿轮加工机床、螺纹加工机床、铣床、刨床、拔床、锯床等…

pyspark 使用udf 进行预测,发现只起了一个计算节点

PySpark UDF 只使用一个计算节点的问题 原因分析 默认的并行度设置 PySpark在执行UDF&#xff08;用户定义函数&#xff09;时&#xff0c;默认可能不会利用所有可用的计算节点。这是因为UDF通常在单个节点上执行&#xff0c;并且如果没有正确设置分区&#xff0c;可能会导致数…

Windows下Python+PyCharm+miniconda+Cuda/GPU 安装步骤

1. 官网安装Python 3.9 Python Release Python 3.9.0 | Python.org 2. 安装pycharm https://download.jetbrains.com/python/pycharm-professional-2023.3.2.exe 3. 安装miniconda Miniconda — miniconda documentation 4. 安装完miniconda 创建虚拟环境 conda create …

Transformer学习(一)

文章目录 transformer介绍为什么处理长序列时会出现梯度消失和梯度爆炸的问题transformer为什么可以用在图像处理上&#xff1f; transformer介绍 Transformer 是一种在深度学习中广泛使用的模型结构&#xff0c;最初由 Vaswani 等人在 “Attention is All You Need” 一文中提…

Java 关于 Object 类中的 finalize() 和 hashCode() 方法

关于 Object 类中的 finalize() 方法。 1、在 Object 类中的源代码&#xff1a; protected void finalize() throws Throwable{} GC&#xff1a;负责调用 finalize() 方法。 2、finalize() 方法只有一个方法体&#xff0c;里面没有代码&#xff0c;而且这个方法是 protected 修…

2023-12-29 贪心算法 分发饼干和摆动序列以及最大子数组和

贪心算法 什么是贪心算法&#xff1f; 就是每一阶段的最优解&#xff0c;从局部的最优解达到全局的最优解&#xff01; 最好用的策略就是举反例&#xff0c;如果想不到反例&#xff0c;那么就试一试贪心吧。 贪心算法一般分为如下四步&#xff1a; 将问题分解为若干个子问…