python解图片迷宫生成路径_用Python代码来解图片迷宫的方法整理

译注:原文是StackOverflow上一个如何用程序读取迷宫图片并求解的问题,几位参与者热烈地讨论并给出了自己的代码,涉及到用python对图片的处理以及广度优先(BFS)算法等。

问题by Whymarrh:

fe2e44437427ccf5e82cfc2f5acfd07b.png

当给定上面那样一张JPEG图片,如何才能更好地将这张图转换为合适的数据结构并且解出这个迷宫?

我的第一直觉是将这张图按像素逐个读入,并存储在一个包含布尔类型元素的列表或数组中,其中True代表白色像素,False代表非白色像素(或彩色可以被处理成二值图像)。但是这种做法存在一个问题,那就是给定的图片往往并不能完美的“像素化”。考虑到如果因为图片转换的原因,某个非预期的白色像素出现在迷宫的墙上,那么就可能会创造出一一条非预期的路径。

经过思考之后,我想出了另一种方法:首先将图片转换为一个可缩放适量图形(SVG)文件,这个文件由一个画布上的矢量线条列表组成,矢量线条按照列表的顺序读取,读取出的仍是布尔值:其中True表示墙,而False表示可通过的区域。但是这种方法如果无法保证图像能够做到百分之百的精确转换,尤其是如果不能将墙完全准确的连接,那么这个迷宫就可能出现裂缝。

图像转换为SVG的另一个问题是,线条并不是完美的直线。因为SVG的线条是三次贝塞尔曲线,而使用整数索引的布尔值列表增加了曲线转换的难度,迷宫线条上的所有点在曲线上都必须经过计算,但不一定能够完美对应列表中的索引值。

假设以上方法的确可以实现(虽然很可能都不行),但当给定一张很大的图像时,它们还是不能胜任。那么是否存在一种更好地方法能够平衡效率和复杂度?

这就要讨论到如何解迷宫了。如果我使用以上两种方法中的任意一种,我最终将会得到一个矩阵。而根据这个问答(http://stackoverflow.com/questions/3097556/programming-theory-solve-a-maze/3097677#3097677),一个比较好的迷宫表示方式应该是使用树的结构,并且使用A*搜索算法来解迷宫。那么如何从迷宫图片中构造出迷宫树呢?有比较好的方法么?

以上废话太多,总结起来问题就是:如何转换迷宫图片?转换成为什么样的数据结构?采用什么样的数据结构能够帮助或阻碍解迷宫?

回答by Mikhail:

这是我的解决方案:

1. 将图片转换为灰度图像(不是直接二值),调整不同颜色的权重使得最终的灰度看起来比较统一,你可以通过简单地调节Photoshop 图像->调整->黑白 菜单中的控制条来实现。

2. 将上一步得到的灰度图片转换为二值图片,可以通过在PS 图像->调整->阈值 菜单中设定适当的阈值来实现

3. 确保正确设置了阈值。使用魔棒工具(参数设置:容差 0、取样点、连续以及消除锯齿)选择空白区域,检查所选区域的边缘不是因为错误的阈值设置而产生的假边缘。事实上,这个迷宫中从start到end应该由联通的空白区域。

4. 人为地在迷宫外部加上边界,确保迷宫漫游者^_^不会从start绕着迷宫跑到终点。:)

5. 选择语言实现广度优先搜索算法(BFS),从start处开始让程序运行。下面的代码我选择用Matlab实现。正如Thomas提到的,没必要纠结于图像的表示形式,你可以直接在二值图像上运行。

以下是用MATLAB实现的BFS代码: function path = solve_maze(img_file)

%% Init data

img = imread(img_file);

img = rgb2gray(img);

maze = img > 0;

start = [985 398];

finish = [26 399];

%% Init BFS

n = numel(maze);

Q = zeros(n, 2);

M = zeros([size(maze) 2]);

front = 0;

back = 1;

function push(p, d)

q = p + d;

if maze(q(1), q(2)) && M(q(1), q(2), 1) == 0

front = front + 1;

Q(front, :) = q;

M(q(1), q(2), :) = reshape(p, [1 1 2]);

end

end

push(start, [0 0]);

d = [0 1; 0 -1; 1 0; -1 0];

%% Run BFS

while back <= front

p = Q(back, :) ;

back = back + 1;

for i = 1:4

push(p, d(i, :) );

end

end

%% Extracting path

path = finish;

while true

q = path(end, :) ;

p = reshape(M(q(1), q(2), :) , 1, 2);

path(end + 1, :) = p;

if isequal(p, start)

break;

end

end

end

这是个简单的实现,应该很容易就能够改写为Python或其他语言,下面是程序的运行结果:

04dda5959ef2dd554cd115b49a81c761.png

提问者更新:

我用Python实现了一下Mikhail的方法,其中用到了numpy库,感谢Thomas推荐。我感觉这个算法是正确的,但是效果不太如预期,以下是相关代码,使用了PyPNG库处理图片。

译注:很遗憾,我用提问者提供的代码并没有跑通程序,并且似乎代码缩进有点问题,而下面其他参与者的代码能够执行通过,并且效果很好。 import png, numpy, Queue, operator, itertools

def is_white(coord, image):

""" Returns whether (x, y) is approx. a white pixel."""

a = True

for i in xrange(3):

if not a: break

a = image[coord[1]][coord[0] * 3 + i] > 240

return a

def bfs(s, e, i, visited):

""" Perform a breadth-first search. """

frontier = Queue.Queue()

while s != e:

for d in [(-1, 0), (0, -1), (1, 0), (0, 1)]:

np = tuple(map(operator.add, s, d))

if is_white(np, i) and np not in visited:

frontier.put(np)

visited.append(s)

s = frontier.get()

return visited

def main():

r = png.Reader(filename = "thescope-134.png")

rows, cols, pixels, meta = r.asDirect()

assert meta['planes'] == 3 # ensure the file is RGB

image2d = numpy.vstack(itertools.imap(numpy.uint8, pixels))

start, end = (402, 985), (398, 27)

print bfs(start, end, image2d, [])

回答by Joseph Kern: #!/usr/bin/env python

import sys

from Queue import Queue

from PIL import Image

start = (400,984)

end = (398,25)

def iswhite(value):

if value == (255,255,255):

return True

def getadjacent(n):

x,y = n

return [(x-1,y),(x,y-1),(x+1,y),(x,y+1)]

def BFS(start, end, pixels):

queue = Queue()

queue.put([start]) # Wrapping the start tuple in a list

while not queue.empty():

path = queue.get()

pixel = path[-1]

if pixel == end:

return path

for adjacent in getadjacent(pixel):

x,y = adjacent

if iswhite(pixels[x,y]):

pixels[x,y] = (127,127,127) # see note

new_path = list(path)

new_path.append(adjacent)

queue.put(new_path)

print "Queue has been exhausted. No answer was found."

if __name__ == '__main__':

# invoke: python mazesolver.py [.jpg|.png|etc.]

base_img = Image.open(sys.argv[1])

base_pixels = base_img.load()

path = BFS(start, end, base_pixels)

path_img = Image.open(sys.argv[1])

path_pixels = path_img.load()

for position in path:

x,y = position

path_pixels[x,y] = (255,0,0) # red

path_img.save(sys.argv[2])

动态执行效果:

5e3ba110f8e4af7e9244f03a238da683.png

回答by Jim

使用树搜索太繁杂了,迷宫本身就跟解路径是可分的。正因如此,你可以使用连通区域查找算法来标记迷宫中的连通区域,这将迭代搜索两次这些像素点。如果你想要更好地解决方法,你可以对结构单元使用二元运算(binary operations)来填充每个连通区域中的死路。

下面是相关的MATLAB代码及运行结果: % read in and invert the image

im = 255 - imread('maze.jpg');

% sharpen it to address small fuzzy channels

% threshold to binary 15%

% run connected components

result = bwlabel(im2bw(imfilter(im,fspecial('unsharp')),0.15));

% purge small components (e.g. letters)

for i = 1:max(reshape(result,1,1002*800))

[count,~] = size(find(result==i));

if count < 500

result(result==i) = 0;

end

end

% close dead-end channels

closed = zeros(1002,800);

for i = 1:max(reshape(result,1,1002*800))

k = zeros(1002,800);

k(result==i) = 1; k = imclose(k,strel('square',8));

closed(k==1) = i;

end

% do output

out = 255 - im;

for x = 1:1002

for y = 1:800

if closed(x,y) == 0

out(x,y,:) = 0;

end

end

end

imshow(out);

056c16291069fff6ffa9daa5ee6157be.png

回答by Stefano

stefano童鞋给出了生成搜索过程GIF及AVI文件的代码 maze-solver-python (GitHub)

8bb79eef8ef88f7247fbc0a61f4c668d.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/442292.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

信号模型噪声服从零均值高斯分布_非高斯噪声下基于分数低阶循环谱的调制识别方法...

1 引言当前&#xff0c;绝大多数非高斯噪声的建模形式都为Alpha稳定分布噪声。首先&#xff0c;Alpha稳定分布符合中心极限定理&#xff0c;在理论上适合应用于实际场景中的噪声建模&#xff1b;其次&#xff0c;Alpha稳定分布由于其参数的可变性&#xff0c;包含高斯分布、柯西…

mysql 时间绝对值_datetime和timestamp--时间戳是绝对值,日期是相对值

遇到的问题&#xff1a;系统时间与数据库时间不一致&#xff0c;系统时间是8:20&#xff0c;存到数据库里是0:20。第一直觉是时区不同导致的。先看一段代码&#xff1a;Java代码public static void main(String[] args) {//System.out.println(TimeZone.getDefault());SimpleDa…

python网络编程自学_五分钟搞定Python网络编程实现TCP和UDP连接

Python网络编程实现TCP和UDP连接, 使用socket模块&#xff0c; 所有代码在python3下测试通过。实现TCP#!/usr/bin/env python3# -*- coding: utf-8 -*-import socket# 创建一个socket:s socket.socket(socket.AF_INET, socket.SOCK_STREAM)# 建立连接:s.connect((www.baidu.co…

java自定义线程_Java自定义线程池详解

自定义线程池的核心&#xff1a;ThreadPoolExecutor为了更好的控制多线程&#xff0c;JDK提供了一套线程框架Executor&#xff0c;帮助开发人员有效的进行线程控制&#xff0c;其中在java.util.concurrent包下&#xff0c;是JDK并发包的核心&#xff0c;比如我们熟知的Executor…

java 垃圾回收 null_java方法中把对象置null,到底能不能加速垃圾回收

今天逛脉脉&#xff0c;看见匿名区有人说java中把对做置null&#xff0c;这种做法很菜&#xff0c;不能加速垃圾回收&#xff0c;但是我看到就觉得呵呵了&#xff0c;我是觉得可以加速置null对象回收的。测试的过程中&#xff0c;费劲的是要指定一个合理的测试堆大小&#xff0…

零基础学java web开发pdf_新手学Java Web开发.pdf

作 者 &#xff1a;杨磊等编著出版发行 : 北京&#xff1a;北京希望电子出版社 , 2010.01ISBN号 &#xff1a;978-7-89498-988-8页 数 &#xff1a; 480丛书名 : 新手学编程系列原书定价 : 49.80主题词 : 计算机编程软件&#xff0c;JAVA WEB中图法分类号 : TP3 ( 工业技术->…

java 外卖订餐系统_java外卖订餐系统小项目

本文实例为大家分享了java外卖订餐系统的具体代码&#xff0c;供大家参考&#xff0c;具体内容如下执行结果&#xff1a;通过选择功能序号&#xff0c;执行响应的功能&#xff1a;代码实现&#xff1a;package 外卖订餐系统;/** 代码优点&#xff0c;使用 循环&#xff1a;* 显…

java 字符串包含某个字符_java中判断字符串中是否包含某个特定字符串的方法有哪些...

判断一个字符串是否包含某个子串的n种方法&#xff1a;1、startsWith()方法2、contains()方法3、indexOf方法startsWith()方法这个方法有两个变体&#xff0c;用于检测字符串是否以指定的前缀开始。此方法定义的语法如下:public boolean startsWith(String prefix, int toffset…

java的方法调用中分不清_java中不太清晰的知识点

一、什么包需要导入&#xff0c;什么包不需要导入1.java.lang包的内容是自动导入的&#xff0c;不需要手动导入&#xff0c;其它必须手动导入。2.java.io.OutputStreamWrite已经是完整的类&#xff0c;无需再导入&#xff0c;而printWrite这个类&#xff0c;并不是调用完整的类…

java生命小游戏_Java修炼——飞机生存小游戏

在学习了java入门的课程之后&#xff0c;自己动手跟着老师写的一个小游戏&#xff0c;用的是Frame。总共有七个类。1.飞机游戏的主窗口(MyGameFrame)继承Frame。package com.bjsxt.plane;import java.awt.Color;import java.awt.Font;import java.awt.Frame;import java.awt.Gr…

链队列的基本运算java_链式队列基本操作的实现问题

问题描述&#xff1a;用链式存储方式实现队列的基本操作涉及变量&#xff1a;front&#xff1a;Node型自定义变量&#xff0c;指向队首元素rear&#xff1a;Node型自定义变量&#xff0c;指向队尾元素涉及教材&#xff1a;《数据结构——Java语言描述(第2版)》 清华大学出版社大…

mysql数据库优化看的书_MySQL 数据库优化,看这篇就够了

点击上方"IT牧场"&#xff0c;选择"设为星标"技术干货每日送达&#xff01;来源&#xff1a;segmentfault.com/a/1190000018631870前言数据库优化一方面是找出系统的瓶颈,提高MySQL数据库的整体性能,而另一方面需要合理的结构设计和参数调整,以提高用户的相…

python 升级所有库_自动更新Python所有第三方库

一般python用得比较久以后&#xff0c;就会安装很多第三方的库。比如这是我的pip list情况&#xff1a;pip list而且一屏还显示不完。通过如下命令可以看到需要更新的第三方库&#xff1a;pip list -o需要更新的库而pip提供的更新命令只能一个个的更新...pip install -U 库名 #…

java 反射 类变量_java反射机制取出model类的所有变量,以及value

工作上遇到个问题,顺便解决了,希望对大家有帮助package com.zuidaima.util;public static void main(String[] args) throws ClassNotFoundException, IllegalArgumentException, IllegalAccessException, InstantiationException {Class> obj Class.forName("com.roi…

php 去掉不可见字符串,php去掉指定字符串的办法

php去掉指定字符串的办法&#xff1a;首先创建一个PHP示例文件&#xff1b;然后定义字符串&#xff1b;最后通过“str_replace(array("_","",""),"",$str);”方法去掉指定字符串即可。推荐&#xff1a;《PHP视频教程》用正则可以解决问…

php文件上传并保存路径到数据库,thinkphp表单上传文件并将文件路径保存到数据库中?...

上传单个文件&#xff0c;此文以上传图片为例&#xff0c;上传效果如图所示创建数据库upload_img,用于保存上传路径CREATE TABLE seminar_upload_img ( id int(11) NOT NULL AUTO_INCREMENT, img_name varchar(255) DEFAULT NULL COMMENT 图片名称, img_url varchar(255) DE…

PHP数组的访问方法有几种,数组常用方法有哪些

数组中常用的方法有&#xff1a;1、给数组末尾添加新内容的push方法&#xff1b;2、删除数组最后一项的pop方法&#xff1b;3、删除数组第一项的shift方法&#xff1b;4、向数组首位添加新内容unshift方法等等。数组常用的一些方法&#xff1a;1、push()向数组的末尾添加新内容…

java opcode 反汇编,如何将VM的opcode嵌入汇编源码中

这次来一个关于VM的混淆办法&#xff0c;可能只是个小trick&#xff0c;仅仅来自胡思乱想也许你会觉得很奇怪&#xff0c;一个VM能有啥新鲜的&#xff0c;对&#xff0c;单纯来说VM保护源代码已经非常的成熟了&#xff0c;所以在这里只做最基本的介绍&#xff0c;而且这次的重点…

php ip 合法,什么是合法ip地址

合法的IP地址中&#xff0c;每个三位数都是在0~254之间的&#xff0c;不可能是大于254就连255都不行。这才是合法的IP地址&#xff0c;还有 IP地址有A\B\C类IP。iPv4的ip地址都是(1~255).(0~255).(0~255).(0~255)的格式。A类的IP地址范围为0.0.0.0-127.255.255.255B类的IP地址范…

php session和cookie区别,php中session和cookie的区别是什么?

一、Session(1)Session的由来以及介绍Session:在计算机中&#xff0c;尤其是在网络应用中&#xff0c;称为“会话控制”,生存时间为用户在浏览某个网站时&#xff0c;从进入网站到关闭这个网站所经过的这段时间&#xff0c;也就是用户浏览这个网站所花费的时间。由于Http是一种…