爬虫练习：获取某招聘网站Python岗位信息

爬虫练习：获取某招聘网站Python岗位信息

news/2025/7/3 3:43:25/文章来源:https://blog.csdn.net/m0_74972727/article/details/136598954

一、相关网站

二、相关代码

import requests
from lxml import etree
import csv
with open('拉钩Python岗位数据.csv', 'w', newline='', encoding='utf-8') as csvfile:fieldnames = ['公司', '规模','岗位','地区','薪资','经验要求']writer = csv.DictWriter(csvfile, fieldnames=fieldnames)writer.writeheader()for page in range(1,31):# url = 'https://www.lagou.com/wn/zhaopin?fromSearch=true&kd=python&city=%E5%85%A8%E5%9B%BD'url = f'https://www.lagou.com/wn/zhaopin?fromSearch=true&kd=python&pn={page}'headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36'}data = {'fromSearch':'true','kd':'python','city':'全国'}response = requests.post(url=url,data=data,headers=headers)# print(response.text)result = etree.HTML(response.text)company = result.xpath('//div[@class="company-name__2-SjF"]/a/text()')scale = result.xpath('//div[@class="industry__1HBkr"]/text()')post = result.xpath('//div[@class="p-top__1F7CL"]/a/text()[1]')location = result.xpath('//div[@class="p-top__1F7CL"]/a/text()[2]')salt = result.xpath('//div[@class="p-bom__JlNur"]/span/text()')suffer = result.xpath('//div[@class="p-bom__JlNur"]/text()[1]')# print(company,scale,post,location,salt,suffer)for com, sca, pos, loc, sal,suf in zip(company, scale, post, location, salt,suffer):print(f'{com} ====== {sca} ====== {pos} ====== {loc} ===== {sal} ===== {suf}')writer.writerow({'公司': com, '规模': sca, '岗位': pos, '地区': loc, '薪资': sal,'经验要求':suf})

三、获取的结果

版权声明和免责声明

本博客提供的所有爬虫代码和相关内容（以下简称“内容”）仅供参考和学习之用。任何使用或依赖这些内容的风险均由使用者自行承担。我（博客所有者）不对因使用这些内容而产生的任何直接或间接损失承担责任。

严禁将本博客提供的爬虫代码用于任何违法、不道德或侵犯第三方权益的活动。使用者应当遵守所有适用的法律法规，包括但不限于数据保护法、隐私权法和知识产权法。

如果您选择使用本博客的爬虫代码，您应当确保您的使用行为符合所有相关法律法规，并且不会损害任何人的合法权益。在任何情况下，我（博客所有者）均不对您的行为负责。

如果您对本声明有任何疑问，或者需要进一步的澄清，请通过我的联系方式与我联系。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/736532.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

springboot262基于spring boot的小型诊疗预约平台的设计与开发

springboot262基于spring boot的小型诊疗预约平台的设计与开发

小型诊疗预约平台摘要现代经济快节奏发展以及不断完善升级的信息化技术，让传统数据信息的管理升级为软件存储，归纳，集中处理数据信息的管理方式。本小型诊疗预约平台就是在这样的大环境下诞生，其可以帮助管理者在短时间内处理…

阅读更多...

【PyTorch实战演练】深入剖析MTCNN(多任务级联卷积神经网络)并使用30行代码实现人脸识别

【PyTorch实战演练】深入剖析MTCNN(多任务级联卷积神经网络)并使用30行代码实现人脸识别

文章目录 0. 前言1. 级联神经网络介绍2. MTCNN介绍2.1 MTCNN提出背景2.2 MTCNN结构 3. MTCNN PyTorch实战3.1 facenet_pytorch库中的MTCNN3.2 识别图像数据3.3 人脸识别3.4 关键点定位 0. 前言按照国际惯例，首先声明：本文只是我自己学习的理解&#xff…

阅读更多...

DenseNet笔记

DenseNet笔记

📒from ©实现pytorch实现DenseNet（CNN经典网络模型详解） - 知乎 (zhihu.com) 是什么之 DenseBlock 读图： x0是inputH1的输入是x0 (input)H2的输入是x0和x1 (x1是H1的输出) Summary： 传统卷积网，网…

阅读更多...

IDEA管理Git + Gitee 常用操作

IDEA管理Git + Gitee 常用操作

文章目录 IDEA管理Git Gitee 常用操作1.Gitee创建代码仓库1.创建仓库1.点击新建仓库2.完成仓库信息填写3.创建成功4.管理菜单可以修改这个项目的设置 2.设置SSH公钥免密登录基本介绍1.找到.ssh目录2.执行指令 ssh-keygen3.将公钥信息添加到码云账户1.点击设置2.ssh公钥3.复制.…

阅读更多...

[力扣 Hot100]Day50 二叉树中的最大路径和

[力扣 Hot100]Day50 二叉树中的最大路径和

题目描述二叉树中的路径被定义为一条节点序列，序列中每对相邻节点之间都存在一条边。同一个节点在一条路径序列中至多出现一次。该路径至少包含一个节点，且不一定经过根节点。路径和是路径中各节点值的总和。给你一个二叉树的根节点 root &…

阅读更多...

ETL与抖音数据同步，让数据流动无阻

ETL与抖音数据同步，让数据流动无阻

在当今数字化时代，数据的价值日益凸显，企业需要从各种渠道获取有关用户行为、市场趋势和竞争对手活动的数据。作为一家专注于数据集成和转换的领先平台，ETLCloud为企业提供了强大的数据同步和转换功能。而与此同时，抖音作为一款热…

阅读更多...

Java中常见的“类”大全

Java中常见的“类”大全

Java 中有很多常见的类，它们提供了各种功能，从基本数据类型的封装到复杂的数据结构和算法。以下是一些常见的 Java 类： 1.Object 类： 所有类的超类，提供了一些通用的方法，如 toString()、equals()、hashCod…

阅读更多...

论文解读：Meta-Baseline: Exploring Simple Meta-Learning for Few-Shot Learning

论文解读：Meta-Baseline: Exploring Simple Meta-Learning for Few-Shot Learning

文章汇总总体问题通过对整体分类的训练(文章结构图中ClassifierBaseline)，即在整个标签集上进行分类，它可以得到与许多元学习算法相当甚至更好的嵌入。这两种工作之间的界限尚未得到充分的探索，元学习在少样本学习中的有效性仍然不清楚。…

阅读更多...

Visual C++ 2010学习版安装教程

Visual C++ 2010学习版安装教程

1. 创建项目点击 “创建新项目”，创建一个项目。 2. 创建 helloworld.c ⽂件 3. 在弹出的编辑框中，选中 “C文件(.cpp)”，将下方 “源.cpp” 手动改为要新创建的文件名。如：helloWorld.c 。注意，默认 cpp 后缀名&am…

阅读更多...

java SSM旅游景点与公交线路查询系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计

java SSM旅游景点与公交线路查询系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计

一、源码特点 java SSM旅游景点与公交线路查询系统是一套完善的web设计系统（系统采用SSM框架进行设计开发，springspringMVCmybatis），对理解JSP java编程开发语言有帮助，系统具有完整的源代码和数据库，系…

阅读更多...

趣学前端 | Taro迁移完成之后，总结了一些踩坑经验

趣学前端 | Taro迁移完成之后，总结了一些踩坑经验

背景四月份的时候，尝试将老的移动端项目改造成多端。因为老项目使用的React框架，综合考量，保障当前业务开发的进度同时，进行项目迁移，所以最后选择了Taro框架。迁移成本会低一些，上手快一些。上个月&am…

阅读更多...

CAN一致性测试:物理层测试之终端电阻测试

CAN一致性测试:物理层测试之终端电阻测试

从本周开始结合工作实践，给大家总结CAN一致性相关的测试包括：物理层、数据链路层、应用层三大块知识点 CAN一致性测试:物理层测试之终端电阻测试试验目的： 测试控制器的 CANH 对地、CANL 对地、CANH 对 CANL 的内阻是否符合 ISO11898-2的…

阅读更多...

读写算杂志《读写算》杂志社读写算杂志社2024年第7期目录

读写算杂志《读写算》杂志社读写算杂志社2024年第7期目录

教育资讯全国学生心理健康工作咨询委员会第一次全体会议召开 1 扩优提质区域先行——基础教育高质量发展现场会在福州晋安召开 1-2 河北唐山曹妃甸：新学期抓好四项工作 2-3 崇红立志——江苏盐城亭湖7万学生争做新时代红色少年 3 习作选登秋…

阅读更多...

ubuntu設定QGC獲取pixhawk Mini4(PX4 Mini 4) 的imu信息

ubuntu設定QGC獲取pixhawk Mini4(PX4 Mini 4) 的imu信息

ubuntu20.04 QGC使用v4.3.0的版本飛控pixhawk Mini4 飛控上只使用一條micro USB連接電腦，沒有其他線安裝命令 sudo apt-get remove modemmanager -y sudo apt install gstreamer1.0-plugins-bad gstreamer1.0-libav gstreamer1.0-gl -y sudo apt install libf…

阅读更多...

简单了解不同行业下4a的定义

简单了解不同行业下4a的定义

工作中我们经常会听见4a这个词语，但大部分人对于4a的定义不是很了解，今天我们就来简单了解下不同行业下4a的定义。简单了解不同行业下4a的定义 1、网络安全领域 4A指的是认证（Authentication）、授权（Authorization…

阅读更多...

ElasticSearch集群的备份和恢复

ElasticSearch集群的备份和恢复

备份方式官方建议采用snapshot方式进行备份与恢复。单节点案例单节点备份首先我们看下单节点的情况下，我们首先需要在配置文件中配置好本地磁盘： path.repo:["/opt/elasticsearch-cluster/snapshot_repo"] 可以配置多个仓库&#xf…

阅读更多...

python之数组，链表，栈，队列

python之数组，链表，栈，队列

1.数组优点： 索引操作速度快：通过索引可以直接访问元素，因此索引操作的时间复杂度是 $O(1)$，即常数级缺点： 插入、删除元素慢： 如果需要在中间或开始位置插入或删除元素，可能需要移动大量…

阅读更多...

加密 / MD5算法 /盐值

加密 / MD5算法 /盐值

目录加密的介绍 MD5算法盐值加密的介绍加密介绍：在MySQL数据库中, 我们常常需要对密码, 身份证号, 手机号等敏感信息进行加密, 以保证数据的安全性。如果使用明文存储, 当黑客入侵了数据库时, 就可以轻松获取到用户的相关信息, 从而对用户或者企业造成信息…

阅读更多...

程序员职业并不会彻底消失

程序员职业并不会彻底消失

目录程序员职业在技术革新背景下面临着怎样的冲击与挑战？程序员职业的核心能力及价值是否能被AI完全取代？程序员的核心能力是什么？

阅读更多...

跨域问题总结

跨域问题总结

文章目录概要web应用整体请求流程技术名词解释跨域问题产生的原理解决方案前端代码角度前端服务器角度后端代码角度后端服务器角度小结概要在不成熟的前后端开发过程中，经常遇到跨域问题； 在前后端分离的模式下的开发过程中，经常遇到跨域…

阅读更多...

最新文章