获取全部的地区并生成表格

思路

        写文章的时间2023-8-4,大部分网页设置的区域都是先是省,然后通过省获取对应的市,再通过市获取对应的区,以此类推。所以模拟的请求也是按照这个逻辑,先获取所有的省,再获取所有的市,最后获取所有的区。


实现方法

        博主其实是需要根据用户指定的地区做一些其他的请求,但是用户不可能知道这个地区对应的id,所以直观的展示就想到:用区域的名作为键,id作为值,但是区域名字可能会相同,例如不同的市但存在同名的区,所以最终想到用嵌套字典的方法来进行存储,因为不可能省市区都是一样的。

所以最终字典的样子是这样子的:


代码

        代码解释

                获取区域对应的id和名字,走了三次循环进行获取,定义一个字典,将获取到的区域的名字作为键,值也是一个字典,这个字典就包含当前区域的id,然后下一级的区域名字,如此嵌套。字典的样子:

{'广东':{"id": "19","潮州市": {"id": "1705","潮安区": {"id": "19992",},},"东莞市": {"id": "1655","常平镇": {"id": "4886",},"长安镇": {"id": "4760",},},},'其他省份':{'以此类推'}
}

         具体详细代码

                对于数据解析部分,由于每个网页返回的结构不一样,需要自己去解析对应的数据

# -*- coding: utf-8 -*- 
# @Time : 2023/7/13 15:05
# @Author : gongzairen
# @File : get_areas_id_dict.pyimport json
import random
import timeimport requestsclass GetAreasId:def __init__(self,sku_id):self.sku_id = sku_idself.data_dict = {}# 获取区域iddef get_areas_id(self):""":return: 返回的是包含省,市,区的id 的dict逻辑很混乱多层嵌套,效果并不好样例:{'北京': {'id': '2', '北京市': {'id': '36', '东城区': {'id': '377'}, }},'天津': {'id': '3', '天津市': {'id': '37', '和平区': {'id': '395'},}}}"""data_dict = {"data": "","error_info": "无",'warning_info': "无",}url = '对应的url'headers = HEADERSheaders['Referer'] = f'对应的referer'headers['Accept'] = '对应的Accept'all_areas_id_dict = {}# 获取省idprovince_payload = {'请求的参数': '请求的参数',}province_response = requests.get(url,params=province_payload,headers=headers)province_json = province_response.json()province_response.close()# print(province_json)try:id_lists = province_json['rows']for id_dict in id_lists:province_name = id_dict['name']province_id_dict = {'id': str(id_dict['id']),'level': str(id_dict['level']),}all_areas_id_dict[province_name] = province_id_dictexcept Exception as e:data_dict['error_info'] = '区域id结果已发生改变,请联系开发人员'print('区域id结果已发生改变,请联系开发人员')print(e)return data_dict# 获取市idfor province_name in all_areas_id_dict:time.sleep(random.uniform(0,2.2))city_payload = {'请求的参数': '请求的参数',}city_response = requests.get(url, params=city_payload, headers=headers)city_json = city_response.json()city_response.close()# print(city_json)try:id_lists = city_json['rows']for id_dict in id_lists:city_name = id_dict['name']city_id_dict = {'id': str(id_dict['id']),'level': str(id_dict['level']),'parentId':str(id_dict['parentId'])}all_areas_id_dict[province_name][city_name] = city_id_dictexcept Exception as e:data_dict['error_info'] = '区域id结果已发生改变,请联系开发人员'print('区域id结果已发生改变,请联系开发人员')print(e)return data_dict# 获取区idfor province_name in all_areas_id_dict:city_list = list(all_areas_id_dict[province_name].keys())for city_name in city_list:if city_name == "id" or city_name == "level":continuetime.sleep(random.uniform(1, 3))area_payload = {'请求的参数': '请求的参数',}area_response = requests.get(url, params=area_payload, headers=headers)area_json = area_response.json()area_response.close()print(area_json)try:id_lists = area_json['rows']for id_dict in id_lists:area_name = id_dict['name']area_id_dict = {'id': str(id_dict['id']),'level': str(id_dict['level']),'parentId':str(id_dict['parentId'])}all_areas_id_dict[province_name][city_name][area_name] = area_id_dictexcept Exception as e:data_dict['error_info'] = '区域id结果已发生改变,请联系开发人员'print('区域id结果已发生改变,请联系开发人员')print(e)return data_dictdata_dict['data] = all_areas_id_dictprint(all_areas_id_dict)return data_dicttest_sku_id = 'xxxxxx'HEADERS = {'Cookie': 'xxxxxx',
}
get_areas_obj = GetAreasId(test_sku_id)
get_areas_result_dict = get_areas_obj.get_areas_id()
if get_areas_result_dict ['error_info'] != "无":print('获取失败')
else:all_areas_id_dict = get_areas_result_dict['data']

生成对应的表 

data = "上面生成的字典" # all_areas_id_dict 
id_lists = []
for province_name in data:city_list = list(data[province_name].keys())for city_name in city_list:if city_name == "id" or city_name == "level" or city_name == 'parentId':continuearea_list = list(data[province_name][city_name].keys())for area_name in area_list:if area_name == "id" or area_name == "level" or area_name == 'parentId':continueid_lists.append([province_name,city_name,area_name])print(id_lists)df = pd.DataFrame(id_lists, columns=['省', '市', '区'])file_name = 'xxxx地区全表.xlsx'
df.to_excel(file_name, index=False)
print(f"Excel文件已生成: {file_name}")

        效果如下 

                ​​​​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/21167.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解决:浮点数(小数)数学运算精度有限 保留固定位数

一、数学运算 问题:0.1 0.2 0.30000000000000004 在JavaScript中,整数和浮点数都属于Number类型,它们都统一采用64位浮点数进行存储。因浮点数的精度有限,会出现精度丢失,舍入误差问题。 const operationObj {/*** …

工作遇到问题与解决办法(一)

一、构建父子工程 父 <groupId>com.ruoyi</groupId> <artifactId>ruoyi</artifactId> <version>3.8.5</version> <modules><module>ruoyi-admin</module><module>ruoyi-framework</module><module>…

PyTorch 中的累积梯度

https://stackoverflow.com/questions/62067400/understanding-accumulated-gradients-in-pytorch 有一个小的计算图&#xff0c;两次前向梯度累积的结果&#xff0c;可以看到梯度是严格相等的。 代码&#xff1a; import numpy as np import torchclass ExampleLinear(torch…

C语言每日一题:13《数据结构》环形链表。

题目链接&#xff1a; 一.环形链表运动基础。 使用快慢指针利用相对移动的思想&#xff1a; 1.第一种情况&#xff1a; 1,令快指针&#xff08;fast&#xff09;速度为2. 2.慢指针&#xff08;slow&#xff09;速度为1. 3.以慢指针进入环中开始。 4。假设slow刚刚进入环中fast…

【夜深人静学习数据结构与算法 | 第十二篇】动态规划——背包问题

目录 前言&#xff1a; 01背包问题&#xff1a; 二维数组思路&#xff1a; 一维数组思路&#xff1a; 总结&#xff1a; 前言&#xff1a; 在前面我们学习动态规划理论知识的时候&#xff0c;我就讲过要介绍一下背包问题&#xff0c;那么今天我们就来讲解一下背包问题。 在这…

机器学习笔记 - 目标检测中的加权框融合与非极大值抑制的对比

一、对象检测后处理 后处理步骤是目标检测中一个琐碎但重要的组成部分。本文主要是为了了解当拥有多个对象检测模型的集合时,加权框融合(WBF)相对于传统非极大值抑制(NMS)作为对象检测中后处理步骤的差异。 对象检测模型通常使用非极大值抑制 (NMS) 作为默认后处理步骤来过…

权限测试点

1. 只给用户单独设置一个权限&#xff0c;设置之后检查该权限是否生效 2.给用户不设置任何权限&#xff0c;设置之后检查该用户能否使用系统 3.给用户设置全部权限&#xff0c;设置之后检查所有权限是否生效 4.给用户设置部分权限&#xff0c;设置后检查部分权限是否生效 5.用户…

NetApp 入门级全闪存系统 AFF A250:小巧而强大

NetApp 入门级全闪存系统 AFF A250&#xff1a;小巧而强大 作为 AFF A 系列中的入门级全闪存系统&#xff0c;AFF A250 不但可以简化数据管理&#xff0c;还能为您的所有工作负载提供令人惊叹的强劲动力&#xff0c;价格也平易近人。 AFF A250&#xff1a;您的新 IT 专家 AFF…

工厂方法模式(Factory Method)

工厂方法模式就是定义一个用于创建对象的接口&#xff0c;让子类决定实例化哪一个类。工厂方法模式将类的实例化&#xff08;具体产品的创建&#xff09;延迟到工厂类的子类&#xff08;具体工厂&#xff09;中完成&#xff0c;即由子工厂类来决定该实例化哪一个类。 Define a…

Knife4j系列--解决不显示文件上传的问题

原文网址&#xff1a;Knife4j系列--解决不显示文件上传的问题_IT利刃出鞘的博客-CSDN博客 简介 本文介绍使用Knife4j时无法上传文件的问题。 问题复现 依赖 <dependency><groupId>com.github.xiaoymin</groupId><artifactId>knife4j-spring-boot-…

golang定时任务库cron实践

简介 cron一个用于管理定时任务的库&#xff0c;用 Go 实现 Linux 中crontab这个命令的效果。之前我们也介绍过一个类似的 Go 库——gron。gron代码小巧&#xff0c;用于学习是比较好的。但是它功能相对简单些&#xff0c;并且已经不维护了。如果有定时任务需求&#xff0c;还…

为什么马斯克和奥特曼都想重振加密货币?

1、前言 加密货币已经死了吗&#xff1f;这个问题的答案取决于谁来回答。一个加密爱好者会给你一百个不同的理由来解释为什么加密货币没有死。特斯拉CEO埃隆马斯克和OpenAI CEO 山姆奥特曼都对加密货币及其在塑造未来世界中的潜在作用有着浓厚的兴趣。 在过去很长一段时间里&…

国内GitHub加速访问工具-Fetch GitHub Hosts

一、工具介绍 Fetch GitHub Hosts是一款开源跨平台的国内GitHub加速访问工具&#xff0c;主要为解决研究及学习人员访问 Github 过慢或其他问题而提供的 Github Hosts 同步工具。 项目原理&#xff1a;是通过部署此项目本身的服务器来获取 github.com 的 hosts&#xff0c;而…

Stability AI旗舰图像模型 SDXL1.0发布,AI绘画进入新的时代

Stability AI于7月26号开源了SDXL1.0文生图模型&#xff0c;要知道距离SDXL0.9开源发布也不过一个月,只能说AI发展日新月异。 根据官网介绍&#xff0c;SDXL1.0经过迭代更新&#xff0c;已经是目前世界上最好的图像生成模型 官网根据Discord上的几代实验模型和外部测试&#…

【力扣刷题 | 第二十四天】

目录 前言&#xff1a; 416. 分割等和子集 - 力扣&#xff08;LeetCode&#xff09; 总结 前言&#xff1a; 今晚我们爆刷动态规划类型的题目。 416. 分割等和子集 - 力扣&#xff08;LeetCode&#xff09; 给你一个 只包含正整数 的 非空 数组 nums 。请你判断是否可以将这…

磁共振图像处理中 fft1c 和 ifft1c 函数的 Python 实现

fft1c 和 ifft1c 是 MRI 图像处理的常用函数。通常使用如下的 Matlab 实现 &#xff08;Michael Lustig&#xff0c;2005&#xff09; function res ifft1c(x,dim)% res fft1c(x) % % orthonormal forward 1D FFT %nsize(x,dim); shftzeros(1,5); shft(dim)ceil(n/2);xcirc…

【UE5】UE5与Python Socket通信中文数据接收不全

最近在使用UE的Socket模块与Python服务器进行通信时遇到了一些坑&#xff0c;特此记录一下。 先来复现一下问题&#xff0c;这里只截取关键代码。 UE端&#xff1a; bool ASoc::SendMsg(const FString& Msg) {TSharedRef<FInternetAddr> TargetAddr ISocketSubsy…

Anaconda+Win10安装保姆级教程(合集)

1.安装Anaconda Anaconda3安装及环境配置 2.在使用Anaconda的过程中经常会出现conda的环境默认会安装在C盘 conda安装环境指定位置解决方案 3.在使用pycharm2023版时&#xff0c;尽管cmd能activate自己安装的新环境&#xff0c;但是pychram一直检测不到 pycharm2023找不到…

springboot后端用WebSocket每秒向前端传递数据,python接收数据

1 springboot 1.1 加依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-websocket</artifactId></dependency> 1.2 WebSocketConfig 后端设置前端请求的网址,注册请求的信息 import org.…

广州银行信用卡中心:强化数字引擎安全,实现业务稳步增长

广州银行信用卡中心是全国城商行中仅有的两家信用卡专营机构之一&#xff0c;拥有从金融产品研发至销售及后期风险控制、客户服务完整业务链条&#xff0c;曾获“2016年度最佳创新信用卡银行”。 数字引擎驱动业务增长 安全左移降低开发风险 近年来&#xff0c;广州银行信用卡…