地理信息门户可以帮助人们更容易地发现、访问和使用地理空间信息, 是地理信息发布、服务和共享的重要环节。许多国家都很重视地理信息门户的 建设,把它作为国家空间数据基础设施(spatial data infrastructure,SDI)的重要组成部分。
GISLite 是地理数据发布的一个项目,使用了本书前面章节中的一些地理信息与互联网方面的一些技术, 做的一个功能简单的 GIS 数据发布系统,以形成一个小型的静态网站,方便地理空间数据的查看与管理。本书两位作者负责与参与的数据中心与知识服务项目的工作,很多数据就通过这种方式发布出来。
由于 GISLite 实现之初写的比较匆忙,没有经过好的设计;而且其处理的内容也比较简单,后面也没有再经过仔细的修改。而且随着使用,代码也在更新之中。在这一章进行说明时,会对设计的思想与涉及的代码进行一些说明, 但不会太详细,以避免代码更新之后与书的内容对应不起来。发布一个版本也许是一种解决的方法,但随时使用最新的代码可能更好一点。
项目的地址为 https://www.osgeo.cn/gislite/ , 这个功能也集成到本书的配套网站中, 通过 http://webgis.cn/gislite-index.html 访问。
先来了解一下开发的背景与设计。
11.1.1. 开发背景
在数据中心工作,经常会有一些地理空间数据需要通过 WebGIS 技术发布出来 。前面提到过数据共享。现在数据共享的工作越来越多。在数据共享中,很多的内容需要充分公开地向用户发布出来。
元数据是了解数据的一种方式,它包含了数据的大小, 各个方面的属性,以及空间范围。科学数据一般也都有缩略图,缩略图也是一个可视化的方式。地理信息方面的一些数据,就是这种方式来快速了解。使用 WebGIS 技术可视化效果更好一些, 而且也是一个管理的一个方式,因为所有的数据能看见,当用的时候,查找更加方便。
在实际使用 WebGIS 技术发布数据时,存在有以下的问题:
有大量发布的需求,需要经常进行配置。也需要进行重新的转换;
Mapfile 的编辑修改需要较多专业的知识;
发布后需要进行查看,以进行检查;
数据发布过程需要的步骤较多,需要通过程序工具集成到一起。
11.1.2. 设计的基本思路
基于以上背景,建立了 GISLite 项目,基本设计思路如下。
GISLite是一个基于开源GIS技术开发,使用了静态网站形式的GIS数据发布的应用程序。基于 MapServer 的服务器端 GIS 数据图层发布管理系统。用于解决发布较多数量的地图时的数据更新、样式修改,以及不同样式组合应用的问题。解决办法是使用 XLSX 文件定义样式,利用MapServer、MapProxy实现GIS数据图层发布管理。主要面向GIS开发人员、学生以及GIS爱好者。
使用 XLSX 是工程实践的妥协。作为一种二进制的文件形式,XLSX 的修改无法使用 Git 等代码管理工具进行历史的记录, 也就无法进行回溯与比较,所以并不能算是一种好的记录方式。在定义 Mapfile 时,其实也可以使用 XML 或 YAML 。YAML 已经比较容易编辑修改,但是依然容易出错。而使用 XLSX 建立好模板,则不需要进行太多的说明,普通的工作人员就可以使用其来修改与更新地图的样式。考虑到地图的样式可能不必需要太多的代码级别的仔细核对,所以最终决定了使用这种方式。
尽量实现数据源唯一性,使用 XLSX 文件定义样式。主要实现 GIS 数据图层的发布,但也实现了多源数据发布为单个地图瓦片, 以及多个图层发布为图层分组的功能。主要有以下特点:
基于 MapServer 、 MapProxy ;
使用开放电子表格格式 XLSX 定义样式 ;
可用于团队地理信息数据快速发布管理 。
11.1.3. 静态网站的优点
在 GISLite 设计中,参考了静态网站程序的方案。
近年来,作为传统动态网站基础架构的替代方案,现代静态网站生成器日渐盛行。许多导致静态网站失败的限制已不复存在。现在,每周都会有新的静态网站生成器发布。简单来说,静态网站生成器就是一个由轻量的标记语言以及模版语言和元数据以及 CSS 预处理器, 加上可以编译成 JavaScript 的语言构成的用来生成静态 HTML , CSS 和 JS 文件的程序。
以 PHP 应用为例,PHP 项目得到广泛应用的一个原因,就是易于部署。项目整体打包在一起,拷贝到约定的目录下,配置好相关的一些参数,就可以运行起来。将数据与程序独立出来,程序提供了功能的接口。
静态网站有以下优点:
访问速度快
即使是优化最好的动态网站,其性能也无法同静态网站相比。并且,对于动态网站而言,缓存失效非常难以恢复,尤其是需要充分利用 CDN 的分布式缓存。静态网站所有内容都储存在 html 里面,不需要后台服务器对内容进行渲染, 避免了查询数据库等操作,而且可以充分利用缓存和 CDN 。
非常安全
动态网站容易遭受蠕虫攻击。据保守估计,超过 70% 的 WordPress 部署容易因为已知漏洞遭受攻击 (超过23%的 WEB 网站以 WordPress 为基础构建)。网站安全两大威胁 SQL 注入和 XSS(cross-site scritpting)攻击, 静态站点都可以很好的避免。
易于部署
静态网站没有后端要求,想部署在哪儿就部署在哪儿。服务器端配置简单。只需要一个 web 服务器程序(apache、nginx)。
利于版本控制
静态网站是由静态文件组成,所以非常容易使用 Git 等工具进行版本控制,非常容易维护。
5.易于集成
另外还有一点就是易于集成。在本书的配套网站中就集成了 GISLite 发布的数据, 见 http://webgis.cn/gislite-index.html 。
基于以上静态网站的特点,适合地图发布服务的应用。因为在用户使用过程中只是浏览、查看,不需要更新、删除等操作, 没有动态网站的需求。
11.1.4. 程序配置
GISLite 基于 MIT 协议开源发布,托管在 github,下载程序, 源代码网址为:https://github.com/bukun/GISLite.git 。
在开始之前,首先下载部署 GISLite 的实例,来了解一下。以下的操作都 以 Ubuntu/Debian 为例。
服务器端的安装配置
程序的运行需要操作系统与应用程序的支持。服务器端的基本环境包括本书涉及的 Apache 、 Python3 、MapServer ;Python 语言所需要的环境包括本书前面章节介绍的 mappyfile 、 MapProxy , 以及 GDAL 、 Markdown、OpenpyXL 等模块。
OpenpyXL 是一个Python库,用于读取/写入Excel xlsx / xlsm / xltx / xltm文件。
Markdown 是一种标志语言,Python-Markdown 则用来进行解析处理。
GDAL 是栅格和矢量地理空间数据格式的转换器库,作为一个库, 它为调用的应用程序提供了所有支持的格式的单个栅格抽象数据模型和单个矢量抽象数据模型。它还带有用于数据转换和处理的各种有用的命令行实用程序。
GISLite 综合使用了本书介绍的技术,在安装使用时首先需要基本的 WebGIS 运行环境。在操作系统中运行如下命令安装基本的环境,由于 mappyfile 未包括在 Debian 源中, 需要使用 Python 的 pip 命令安装。
sudo apt install -y apache2 php libapache2-mod-fcgid cgi-mapserver mapserver-bin libapache2-mod-phpsudo apt install -y python3-openpyxl python3-mapproxy python3-markdownsudo apt install -y build-essential python3-gdal python3-pippip3 install mappyfile
程序安装与配置
为了进行说明,先将 GISLite 配置安装一下。
首先获取源代码, 使用命令:
git clone https://github.com/bukun/GISLite/
GISLite 运行需要有数据支持,可以到 http://webgis.cn 网站将示例数据下载下来。
有了数据之后,需要使用配置文件将说明项目的地址、数据的位置等信息。由于 Python 语言的特征,直接将配置信息写到 .py 文件中。cfg_demo.py 文件是一个包括配置信息的模板文件, 程序运行时需要 cfg.py 文件。将 cfg_demo.py 文件复制为 cfg.py , 并进行相应的修改。
下面是一个基本的例子,进行一下简要说明。
TILE_SVR = '192.168.56.1:8011'GIS_BASE = '/home/bk/opt/geodemo'SITE_WS = '/home/bk/github/GISLite'USER = 'bk'
这几个变量是必须要定义的。
TILE_SVR 声明服务器端瓦片服务的地址与接口,
GIS_BASE 声明地理空间数据库所在的目录,
SITE_WS 声明项目(即代码库)的目录,
USER 声明进行操作的用户名,这个用户需要在 sudo 组内。
cfg.py 中的定义是比较灵活的。如果要使用远程部署,可以将服务器登陆的信息放到这里:
machines = { 'aliyun3': {'u': 'bk', 'h': '192.168.56.1', 'p': 'passwd', 'ws': 'workspace'},}mach = machines['aliyun3']
现在可以在代码仓库下运行:
python3 build_gislite.py
运行后会生成地图图层的 Mapfile ,网站 HTML 文件,以及运行 MapProxy 需要的文件。这会生成一个静态的网站。其中 Mapfile 是由主文件与各图层定义的 Mapfile 组成。
文件生成后,需要使用下面命令将 MapProxy 服务运行起来:
cd wcs_imgmap/usr/lib/python3-mapproxy/mapproxy-util serve-develop ./mapproxy.yaml -b 0.0.0.0:8013
在 Web 浏览器内打开就可以浏览发布的 GIS 数据了 。
以上就是《开源WebGIS》教程系列——11.1 GISLite 的开发背景与设计的