爬虫综合案例-获取房源信息并在地图上显示

文章目录

    • 1.项目介绍
    • 2.项目分析
    • 3.爬取房源信息
    • 4. 导入高德地图
    • 5.地图上显示房源信息
    • 6.运行程序

1.项目介绍

  • 本次案例将从 58 同城信息网爬取相关城市的房源出租信息,然后通过高德地图把房源信息地图显示,通过地图进行浏览,点击相应的热点文字,即可打开详细的信息页面。

2.项目分析

将通过58同城信息网实现房源信息的获取。在获取房源信息前.需要得到网络请求地址,使用浏览器打开58同城官方网站.选抒房 产一租房。然后以北京城市为例选择品牌公寓,再依次选择位置-朝阳-望京-租金-2000-3000,此时刷新页面后得到的网页地址如下:

https://bj.58.com/

https://bj.58.com/wangjing/pinpaigongyu/?minprice=2000_3000&PGTID=0d3111f6-004b-3728-a9ce-945c1285c742&ClickID=1

经过不断的观察与分析,终于得到了获取58同城房源信息的请求地址,接下来将通过请求地址进行房源数据的分析,然后实现房源数据的爬取,并将爬取后的数据生成房溉信息文件。

3.爬取房源信息

新建Python文件,保存为crawl.py,输入下面代码,用来抓取房源信息,并保存为renting.csv

import requests  # 网络请求模块
from bs4 import BeautifulSoup  # 网页解析模块
import csv  # csv文件模块def get_html():# 网址url = 'https://bj.58.com/wangjing/pinpaigongyu/pn/{page}/?minprice=2000_3000'# 初始化页码page = 0# 打开re.csv文件,如果没有就创建一个,并设置写入模式csv_file = open('renting.csv', 'w', encoding='utf_8_sig', newline='')# 创建writer对象writer = csv.writer(csv_file, dialect='excel')# 循环所有页面while True:page += 1# 抓取目标页面response = requests.get(url.format(page=page))response.encoding = 'utf-8'  # 设置编码方式# 创建一个BeautifulSoup对象,获取页面正文html = BeautifulSoup(response.text, "html.parser")# 获取当前页面的房子信息house_list = html.select(".list > li")print('正在下载网页', url.format(page=page))page_a_list = html.find('div',class_='page')   # 查看页面中是否有切换页面的按钮if page_a_list !=None:                        # 判断存在切换页面的按钮时page_a_list=page_a_list.select('span')     # 查找关于按钮名称的代码str_page = str(page_a_list)                # 将代码转换成字符类型if '<span>下一页</span>' in str_page:     # 判断当前页面是否有“下一页按钮”write_file(house_list,writer)         # 如果有就写入数据并继续循环下一页else:                                    # 否则就写入当前页面的数据,跳出循环write_file(house_list,writer)# 关闭文件csv_file.close()breakelse:                                        # 当前页面没有切换按钮时,写入当前页面数据,跳出循环write_file(house_list, writer)# 关闭文件csv_file.close()breakdef write_file(house_list,writer):# 便利房子信息for house in house_list:if house != None:# 获取房子标题house_title = house.find('div', class_='img').img.get('alt')# 对标题进行分隔house_info_list = house_title.split()# 获取房子位置house_location = house_info_list[1]# 获取房子链接地址house_url = house.select("a")[0]["href"]# 写入一行数据writer.writerow([house_title, house_location, house_url])get_html()

运行上面文件,抓取房源信息,保存到当前目录中,如下图所示。

在这里插入图片描述

4. 导入高德地图

新建HTML文档,保存为index.html,使用JavaScript导入高德地图。

<html>
<head><meta charset="utf-8"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="viewport" content="initial-scale=1.0, user-scalable=no,width=device-width"><title>高德地图+58租房</title><link rel="stylesheet" href="http://cache.amap.com/lbs/static/main1119.css"/><link rel="stylesheet" href="http://cache.amap.com/lbs/static/jquery.range.css"/><script src="http://cache.amap.com/lbs/static/jquery-1.9.1.js"></script><script src="http://cache.amap.com/lbs/static/es5.min.js"></script><script src="http://webapi.amap.com/maps?v=1.3&key=7af41c9af70b3fd698f07b8f4508b2b9&plugin=AMap.ArrivalRange,AMap.Scale,AMap.Geocoder,AMap.Transfer,AMap.Autocomplete"></script>
<style>
/*面板控制样式*/
.control-panel {position: absolute;top: 30px;left: 20px;
}
/*面板内容样式*/
.control-entry {width: 290px;background-color: rgba(119, 136, 153, 0.8);font-family: fantasy, sans-serif;text-align: left;color: white;overflow:hidden;padding: 10px;margin-bottom: 10px;
}
/*文字与右侧的距离*/
.control-input {margin-left: 120px;
}
/*输入框宽度*/
.control-input input[type="text"] {width: 160px;
}
/*文字样式*/
.control-panel label {float: left;width: 120px;
}
/*路线规划信息窗体样式*/
#transfer-panel {
position: absolute;
background-color: white;
max-height: 80%;
overflow-y: auto;
top: 150px;
left: 20px;
width: 250px;
}
</style></head>
<body>
<div id="container"></div>
<!--显示输入地址面板-->
<div class="control-panel"><div class="control-entry"><label>输入工作地点:</label><div class="control-input"><input id="work-location" type="text"></div></div><!--显示导入房源的面板--><div class="control-entry"><label>导入房源文件:</label><div class="control-input"><input type="file" name="file" onChange="importRentInfo(this)"/></div></div>
</div>
<div id="transfer-panel"></div><script>//地图部分var map = new AMap.Map("container", {resizeEnable: true,               //页面可调整大小zoomEnable: true,                 //可缩放center: [116.397428, 39.90923],   //地图中心,这里使用的是北京的经纬度zoom: 11                          //缩放等级,数字越大离地球越近});//添加标尺var scale = new AMap.Scale();map.addControl(scale);//经度,纬度,时间,通勤方式(默认是地铁+公交)
var x, y, t, vehicle = "SUBWAY,BUS";
//工作地点,工作标记
var workAddress, workMarker;
//房源标记数组
var rentMarkerArray = [];
//多边形数组,存储到达范围的计算结果
var polygonArray = [];
//路线规划
var amapTransfer;//到达范围对象
var arrivalRange = new AMap.ArrivalRange();//信息窗体对象
var infoWindow = new AMap.InfoWindow({offset: new AMap.Pixel(0, -30)
});//地址自动补全对象
var auto = new AMap.Autocomplete({//根据id指定输入内容input: "work-location"
});
//添加事件监听,在选择完地址以后调用workLocationSelected
AMap.event.addListener(auto, "select", workLocationSelected);//选择工作地点后触发的方法
function workLocationSelected(e) {//更新工作地点,加载到达范围workAddress = e.poi.name;//调用加载1小时到达区域的方法loadWorkLocation();
}//加载工作地点标记
function loadWorkMarker(x, y, locationName) {workMarker = new AMap.Marker({map: map,title: locationName,icon: 'http://webapi.amap.com/theme/v1.3/markers/n/mark_r.png',position: [x, y]});
}
//清除已有的到达区域
function delWorkLocation() {if (polygonArray) map.remove(polygonArray);if (workMarker) map.remove(workMarker);polygonArray = [];
}//加载到达范围
function loadWorkRange(x, y, t, color, v) {arrivalRange.search([x, y], t, function(status, result) {if (result.bounds) {for (var i = 0; i < result.bounds.length; i++) {//多边形对象var polygon = new AMap.Polygon({map: map,fillColor: color,    //填充色fillOpacity: "0.4",  //透明度strokeWeight: 1      //线宽});//到达范围的多边形路径polygon.setPath(result.bounds[i]);//增加多边形polygonArray.push(polygon);}}}, {policy: v});
}
//加载1小时到达区域
function loadWorkLocation() {//清除已有的到达区域delWorkLocation();//创建地址坐标对象var geocoder = new AMap.Geocoder({city: "北京",radius: 1000});//获取位置geocoder.getLocation(workAddress, function(status, result) {if (status === "complete" && result.info === 'OK') {var geocode = result.geocodes[0];   //获取地址编码x = geocode.location.getLng();      //经度y = geocode.location.getLat();      //纬度//加载工作地点标记loadWorkMarker(x, y);//加载工作地点1小时内到达的范围loadWorkRange(x, y, 60, "#3f67a5", vehicle);//地图移动到工作地点的位置map.setZoomAndCenter(12, [x, y]);}})
}
//导入房源信息触发的方法
function importRentInfo(fileInfo) {//获取房源文件名称var file = fileInfo.files[0].name;loadRentLocationByFile(file);
}//清除现有的房源标记
function delRentLocation() {if (rentMarkerArray) map.remove(rentMarkerArray);rentMarkerArray = [];
}
//加载房源位置
function loadRentLocationByFile(fileName) {//清除现有的房源标记delRentLocation();//所有的地点都记录在集合中var rent_locations = new Set();//获取文件中的房源信息$.get(fileName, function(data) {//分割信息data = data.split("\n");//遍历房源位置data.forEach(function(item, index) {rent_locations.add(item.split(",")[1]);});rent_locations.forEach(function(element, index) {//加上房源标记addMarkerByAddress(element);});});
}
//添加房源标记
function addMarkerByAddress(address) {//地理编码对象var geocoder = new AMap.Geocoder({city: "北京",radius: 1000});//获取位置geocoder.getLocation(address, function(status, result) {if (status === "complete" && result.info === 'OK') {//获取地理编码var geocode = result.geocodes[0];//标记对象rentMarker = new AMap.Marker({map: map,        //显示标记的地图title: address,  //鼠标移动至标记时所显示的文字//标记图标地址icon: 'http://webapi.amap.com/theme/v1.3/markers/n/mark_b.png',//位置position: [geocode.location.getLng(), geocode.location.getLat()]});rentMarkerArray.push(rentMarker);//相关房源网络地址rentMarker.content = "<div>房源:<a target = '_blank'href='http://bj.58.com/pinpaigongyu/?key=" + address + "'>" + address + "</a><div>"//标记的事件处理rentMarker.on('click', function(e) {//设置信息窗体显示的内容infoWindow.setContent(e.target.content);infoWindow.open(map, e.target.getPosition());//路线规划是否清除if (amapTransfer) amapTransfer.clear();//换乘对象amapTransfer = new AMap.Transfer({map: map,policy: AMap.TransferPolicy.LEAST_TIME,city: "北京市",panel: 'transfer-panel'});//根据起、终点坐标查询换乘路线amapTransfer.search([{keyword: workAddress}, {keyword: address}], function(status, result) {})});}})
}</script>
</body>
</html>

抓取房源信息,保存到当前目录中,运行上面文件,如下图所示。

在这里插入图片描述

5.地图上显示房源信息

新建Python文档,保存为ihttp_server.py,输入下面代码,设计一个临时HTTP运行服务器。

# 导入服务器模块
from http.server import HTTPServer, CGIHTTPRequestHandler
# 端口
PORT = 8000
# 创建服务器对象
httpd = HTTPServer(("", PORT), CGIHTTPRequestHandler)
print("serving at port", PORT)
# 反复处理连接请求
httpd.serve_forever()

6.运行程序

运行http_server.py,开启一个临时的HTTP Server服务器。

在浏览器的地址栏当中输入http://localhost:8000/,将显示高德地图的运行效果,如上图所示。

打开地图网页后,在编辑框中输入工作地点,将显示自动补全的信息提示。工作地点选择完成以后,将在地图中显示1小时内可以到达的范围。

单击选择文件按钮导入房源信息文件。房源文件导入后,网页中的地图将自动显示房源位置的标记。如下图所示。
在这里插入图片描述

单击任意房源位置的标记,地图将显示起点至终点的路线规划图,然后地图左侧将显示路线规划具体的信息。单击标记顶部的房源名称,将打开该房源相关信息的网页地址,如下图所示。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/757284.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[运维] 可视化爬虫易采集-EasySpider(笔记)

一、下载 ​下载地址 下滑到Assets页面&#xff0c;选择下载 二、解压运 ​解压压缩包&#xff0c;打开文件夹 在此文件夹下打开Linux Terimal, 并输入以下命令运行软件&#xff1a; ./easy-spider.sh 注意软件运行过程中不要关闭terminal。 三、使用 1.开始 首先点击…

使用 CSS 实现毛玻璃效果

在现代 Web 设计中,毛玻璃效果越来越受欢迎。它能够让界面元素看起来更加柔和、朦胧,同时又不会完全遮挡背景内容,给人一种透明而又不失质感的视觉体验。虽然过去实现这种效果需要借助图像编辑软件,但现在只需要几行 CSS 代码,就可以在网页上呈现出令人惊艳的毛玻璃效果。 使用…

IDEA 配置阿里规范检测

IDEA中安装插件 配置代码风格检查规范 使用代码风格检测 在代码类中&#xff0c;右键 然后会给出一些不符合规范的修改建议&#xff1a; 保存代码时自动格式化代码 安装插件&#xff1a; 配置插件&#xff1a;

SPSS k-均值聚类的 anova分析表解读

from&#xff1a;SPSS K均值聚类&#xff08;k-means&#xff09;和可视化方法 - CollinsLi - 博客园 (cnblogs.com) F值&#xff1a;变量对聚类的贡献 显著性水平&#xff1a;<0.05 则因子显著

CMake笔记之PROJECT_SOURCE_DIR、CMAKE_SOURCE_DIR、CMAKE_CURRENT_BINARY_DIR对比

CMake笔记之PROJECT_SOURCE_DIR、CMAKE_SOURCE_DIR、CMAKE_CURRENT_BINARY_DIR对比 —— 杭州 2024-03-19 夜 code review! 文章目录 CMake笔记之PROJECT_SOURCE_DIR、CMAKE_SOURCE_DIR、CMAKE_CURRENT_BINARY_DIR对比1.三者区别2.具体示例说明3.CMAKE_SOURCE_DIR 和 PROJECT_S…

Sora没体验资格?开源项目:Open-Sora,复现类Sora视频生成方案

项目简介 Open-Sora项目是一项高效制作高质量视频的工作&#xff0c;明确所有权使用其模型、工具和内容的计划。通过采用开源原则&#xff0c;Open-Sora 不仅实现了先进的视频生成技术的普及&#xff0c;还提供了一个专业且用户界面的方案&#xff0c;简化了视频制作的复杂性。…

php 对接Pangle海外广告平台收益接口Reporting API

今天对接的是Pangle广告reporting api接口&#xff0c;拉取广告收益回来自己做统计。记录分享给大家 首先是文档地址,进入到Pangle后台就能看到文档地址以及参数&#xff1a; 文档地址&#xff1a;https://www.pangleglobal.com/zh/integration/reporting-api-v2 在这里插入图片…

算法---二分查找练习-2(寻找旋转排序数组中的最小值)

寻找旋转排序数组中的最小值 1. 题目解析2. 讲解算法原理3. 编写代码 1. 题目解析 题目地址&#xff1a;点这里 2. 讲解算法原理 首先&#xff0c;检查数组的最后一个元素是否大于第一个元素。如果是&#xff0c;说明数组没有进行旋转&#xff0c;直接返回第一个元素作为最小值…

稀碎从零算法笔记Day22-LeetCode:

题型&#xff1a;链表 链接&#xff1a;2. 两数相加 - 力扣&#xff08;LeetCode&#xff09; 来源&#xff1a;Leet 题目描述 给你两个 非空 的链表&#xff0c;表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的&#xff0c;并且每个节点只能存储 一位 数字。 …

vue项目:使用xlsx导出Excel数据

文章目录 一、安装xlsx二、报错及解决三、编写公共方法四、方法使用 一、安装xlsx 执行命令&#xff1a;npm i xlsx file-saver --save 二、报错及解决 使用时&#xff1a;import XLSX from "xlsx"; 发现如下报错信息 报错原因&#xff1a;xlsx版本不兼容。 解…

Java项目基于SpringBoot和Vue的时装购物系统的设计与实现

今天要和大家聊的是一款基于SpringBoot和Vue的时装购物系统。 &#x1f495;&#x1f495;作者&#xff1a;李同学 &#x1f495;&#x1f495;个人简介&#xff1a;混迹在java圈十年有余&#xff0c;擅长Java、微信小程序、Python、Android等&#xff0c;大家有这一块的问题可…

web前端之不一样的下拉菜单、不选中第一个元素的样式效果、伪类排除第一个元素、符号选择器、hover、not、first、child

MENU 效果图htmlcssJShtmlcss 效果图 htmlcssJS html <nav><ul><li class"navli"><h4>HTML5</h4><ul class"ulson"><li class"lison">HTML5</li></ul></li><li class"na…

Django单表数据库操作

单表操作 测试脚本 当你只想测试django某一个py文件的内容,可以不用书写前后端的交互,直接写一个测试脚本即可 单表删除 数据库操作方法: 1.all():查询所有的数据 2.filter():带有过滤条件的查询 3.get():直接拿数据对象,不存在则报错 4.first():拿queryset里面的第一个元素…

天童知识课堂|“春分”

春色正中分&#xff0c;人间恰良辰。春分&#xff0c;也称升分&#xff0c;是二十四节气之一。春分的到来&#xff0c;意味着春天已经过去一半了&#xff0c;气候也逐渐温暖&#xff0c;阳光更加明媚。而关于春分的知识&#xff0c;你知道多少呢&#xff1f;来和天童美语一起了…

鸿蒙开发实战:【系统服务管理部件】

简介 samgr组件是OpenHarmony的核心组件&#xff0c;提供OpenHarmony系统服务启动、注册、查询等功能。 系统架构 图 1 系统服务管理系统架构图 目录 /foundation/systemabilitymgr ├── samgr │ ├── bundle.json # 部件描述及编译文件 │ ├── frameworks …

vue+elementui中table实现单选行功能

el-table插件可以选择行&#xff0c;但是只能多选&#xff0c;而项目中有单选的需求。 效果如下图所示&#xff0c;点击行或者点击复选框都可以选中行&#xff08;高亮&#xff0c;复选框选中&#xff09;&#xff0c;并且每次只选中当前行&#xff0c;之前选中的行清空。点击标…

Elasticsearch:让你的 Elasticsearch 索引与 Python 和 Google Cloud Platform 功能保持同步

作者&#xff1a;来自 Elastic Garson Elasticsearch 内的索引 (index) 是你可以将数据存储在文档中的位置。 在使用索引时&#xff0c;如果你使用的是动态数据集&#xff0c;数据可能会很快变旧。 为了避免此问题&#xff0c;你可以创建一个 Python 脚本来更新索引&#xff0…

端口如何映射到外网?

在现代信息化社会中&#xff0c;远程访问已经成为人们工作和生活中不可或缺的一部分。复杂的网络环境和网络限制可能会给远程连接带来不便。在这种情况下&#xff0c;端口映射到外网的技术应运而生。本文将介绍端口映射到外网的概念、应用场景以及一种优秀的解决方案——【天联…

Docker-安装

Docker ⛅Docker-安装&#x1f320;各平台支持情况&#x1f320;Server 版本安装☃️Ubuntu☃️Centos &#x1f320;Docker 镜像源修改&#x1f320;Docker 目录修改 ⛅Docker-安装 &#x1f320;各平台支持情况 &#x1f320;Server 版本安装 ☃️Ubuntu &#x1f342;安装…

LiveGBS流媒体平台GB/T28181功能-HTTPS 服务支持配置开启什么时候需要开启HTTPS测试SSL证书配置HTTPS测试证书

LiveGBS功能支持HTTPS 服务支持配置开启什么时候需要开启HTTPS测试SSL证书配置HTTPS测试证书 1、配置开启HTTPS1.1、准备https证书1.1.1、选择Nginx类型证书下载 1.2、配置 LiveCMS 开启 HTTPS1.2.1 web页面配置1.2.2 配置文件配置 2、HTTPS测试证书3、验证HTTPS服务4、为什么要…