Python----Python爬虫(利用bs4、pyquery、xpath爬取电影名和评分)

电影网址电影大全_好看的电影_最新好看的电影_电影排行榜-影视快搜

一、bs4

import requests
from fake_useragent import  UserAgent
from bs4 import  BeautifulSoup
# 设置URL地址
url='http://kan.znds.com/movie/'
# 设置请求头
headers={'User-Agent':UserAgent().edge}
# 发送请求
resp=requests.get(url,headers)
# 创建BeautifulSoup对象
soup=BeautifulSoup(resp.text,'lxml')
# 解析响应
names=[i.text.split('\n')[1] for i in soup.select('div.film_box>a>p')]
scores=[i.text.split('\n')[1] for i in soup.select('div.sorce')]
# 输出结果
for n,s in zip(names,scores):print(f'名称:{n}=====评分:{s}')

二、pyquery

import requests
from fake_useragent import  UserAgent
from pyquery import  PyQuery as pq
# 设置URL地址
url='http://kan.znds.com/movie/'
# 设置请求头
headers={'User-Agent':UserAgent().edge}
# 发送请求
resp=requests.get(url,headers)
# 创建pyquery对象
p=pq(resp.text)
# 解析响应
names=[p('p.text-center').eq(i).text() for i  in range(len(p('p.text-center')))]
scores=[p('div.sorce').eq(i).text() for i  in range(len(p('div.sorce')))]
# 输出结果
for n,s in zip(names,scores):print(f'名称:{n}=====评分:{s}')

三、xpath

import requests
from fake_useragent import  UserAgent
from lxml import  etree
# 设置URL地址
url='http://kan.znds.com/movie/'
# 设置请求头
headers={'User-Agent':UserAgent().edge}
# 发送请求
resp=requests.get(url,headers)
# 创建etree对象
e=etree.HTML(resp.text)
# 解析响应
names=[i.replace('\n','') for i in e.xpath('//p[@class="text-center"]/text()')]
scores=[i.replace('\n','') for i in e.xpath('//div[@class="sorce"]/text()')]
# 输出结果
for n,s in zip(names,scores):print(f'名称:{n}=====评分:{s}')

结果 

名称:太极之异兽冢=====评分:7.3分
名称:阿凡达=====评分:9.2分
名称:《你好,李焕英》“这是什么样的家庭啊”版预告=====评分:8.3分
名称:五月天追梦3DNA=====评分:7.1分
名称:美女与野兽=====评分:8.5分
名称:长津湖=====评分:9.5分
名称:东北猛兽=====评分:8.9分
名称:画质牛逼!国产动画《雄狮少年》预告,2021暑期上映=====评分:8.4分
名称:749局=====评分:8.0分
名称:豪侠=====评分:8.5分
名称:金刚狼3:殊死一战=====评分:8.8分
名称:《超能一家人》预告艾伦被家人坑惨沈腾演史上最诚实反派=====评分:7.9分
名称:欢乐好声音=====评分:9.1分
名称:幻术先生=====评分:8.6分
名称:见鬼十法=====评分:8.5分
名称:八佰=====评分:9.3分
名称:扫黑·决战=====评分:9.0分
名称:三脚虎=====评分:8.3分
名称:金玉盟=====评分:8.5分
名称:狂暴巨兽=====评分:8.7分
名称:天龙八部之乔峰传=====评分:7.4分
名称:猎局=====评分:8.5分
名称:我的女主角=====评分:8.5分
名称:倚天屠龙记之九阳神功=====评分:7.6分
名称:江山美人(1959)=====评分:8.5分
名称:最佳女朋友=====评分:8.5分
名称:Hello锦衣卫=====评分:8.8分
名称:山羊的故事=====评分:8.5分
名称:新神榜哪吒重生[粤]=====评分:8.2分
名称:空中灾难=====评分:8.5分

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/892100.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Hbuilder ios 离线打包sdk版本4.36,HbuilderX 4.36生成打包资源 问题记录

1、打包文档地址https://nativesupport.dcloud.net.cn/AppDocs/usesdk/ios.html#%E9%85%8D%E7%BD%AE%E5%BA%94%E7%94%A8%E7%89%88%E6%9C%AC%E5%8F%B7 2、配置应用图标 如果没有appicon文件,此时找到 Assets.xcassets 或者 Images.xcassets(看你sdk引入的启动文件中…

TCP通信原理学习

TCP三次握手和四次挥手以及为什么_哔哩哔哩_bilibili

unity学习13:gameobject的组件component以及tag, layer 归类

目录 1 gameobject component 是unity的基础 1.1 类比 1.2 为什么要这么设计? 2 从空物体开始 2.1 创建2个物体 2.2 给 empty gameobject添加组件 3 各种组件和新建组件 3.1 点击 add component可以添加各种组件 3.2 新建组件 3.3 组件的操作 3.4 特别的…

MYSQL--------什么是存储过程和函数

什么是存储过程和函数 存储过程: 存储过程是一组预编译的 SQL 语句集合,存储在数据库服务器中,可通过名称调用执行。它可以包含数据操作语言(DML)、数据定义语言(DDL)、控制流语句等。存储过程主…

计算机网络 (30)多协议标签交换MPLS

前言 多协议标签交换(Multi-Protocol Label Switching,MPLS)是一种在开放的通信网上利用标签引导数据高速、高效传输的新技术。 一、基本概念 MPLS是一种第三代网络架构技术,旨在提供高速、可靠的IP骨干网络交换。它通过将IP地址映…

探索Facebook的区块链计划:未来社交网络的变革

随着区块链技术的迅速发展,社交网络领域正面临一场深刻的变革。Facebook,作为全球最大且最具影响力的社交平台之一,正在积极探索区块链技术的应用。本文将深入探讨Facebook的区块链计划,分析其潜在的变革性影响,并展望…

十年后LabVIEW编程知识是否会过时?

在考虑LabVIEW编程知识在未来十年内的有效性时,我们可以从几个角度进行分析: ​ 1. 技术发展与软件更新 随着技术的快速发展,许多编程工具和平台不断更新和改进,LabVIEW也不例外。十年后,可能会有新的编程语言或平台…

C# async和await

第一种: 多个异步任务按照顺序执行先让一个异步任务start 然后通过ContinueWith方法 在参数函数的表达式里面开启第二个任务如果要有第三个任务 需要在第二个任务ContinueWith方法中开启第三个任务 以此类推 可以实现多个异步任务顺序执行 上面这种方式绘出现地狱回…

Excel 技巧03 - 如何对齐小数位数? (★)如何去掉小数点?如何不四舍五入去掉小数点?

这几个有点儿关联,我都给放到一起了,不影响大家分别使用。 目录 1,如何对齐小数位数? 2,如何去掉小数点? 3,如何不四舍五入去掉小数点? 1,如何对齐小数位数&#xff…

node.js|浏览器插件|Open-Multiple-URLs的部署和使用,实现一键打开多个URL的强大工具

前言: 在整理各类资源的时候,可能会面临资源非常多的情况,这个时候我们就需要一款能够一键打开多个URL的浏览器插件了 说简单点,其实,迅雷就是这样的,但是迅雷是基于内置nginx浏览器实现的,并…

“AI 视频图像识别系统,开启智能新视界

咱老百姓现在的生活啊,那是越来越离不开高科技了,就说这 AI 视频图像识别系统,听起来挺高大上,实际上已经悄无声息地融入到咱们日常的方方面面,给咱带来了超多便利。 先讲讲安防领域吧,这可是 AI 图像识别的…

C语言 游动的小球

代码如下&#xff1a; 在这里插入代码片#include<stdio.h> #include<stdlib.h> #include<windows.h>int main() {int i,j;int x 5;int y 10;int height 20;int velocity_x 1;int velocity_y 1;int left 0;int right 20;int top 0;int bottom 10;while(1){…

基于SpringBoot实现的保障性住房管理系统

&#x1f942;(❁◡❁)您的点赞&#x1f44d;➕评论&#x1f4dd;➕收藏⭐是作者创作的最大动力&#x1f91e; &#x1f496;&#x1f4d5;&#x1f389;&#x1f525; 支持我&#xff1a;点赞&#x1f44d;收藏⭐️留言&#x1f4dd;欢迎留言讨论 &#x1f525;&#x1f525;&…

安卓触摸对焦

1. 相机坐标说明 触摸对焦需要通过setFocusAreas()设置对焦区域&#xff0c;而该方法的参数的坐标&#xff0c;与屏幕坐标并不相同&#xff0c;需要做一个转换。 对Camera&#xff08;旧版相机API&#xff09;来说&#xff0c;相机的坐标区域是一个2000*2000&#xff0c;原点…

湖南引力:低代码技术助力军工企业实现设备管理系统创新

背景介绍 在核工业相关生产领域&#xff0c;随着技术的持续进步&#xff0c;生产活动对设备的依赖性日益增强。随着企业规模的不断扩大&#xff0c;所涉及的设备数量和种类也在急剧增长&#xff0c;这使得传统的设备管理模式逐渐显得力不从心。企业当前的设备管理主要依赖人工…

【701. 二叉搜索树中的插入操作 中等】

题目&#xff1a; 给定二叉搜索树&#xff08;BST&#xff09;的根节点 root 和要插入树中的值 value &#xff0c;将值插入二叉搜索树。 返回插入后二叉搜索树的根节点。 输入数据 保证 &#xff0c;新值和原始二叉搜索树中的任意节点值都不同。 注意&#xff0c;可能存在多…

VR+智慧消防一体化决策平台

随着科技的飞速发展&#xff0c;虚拟现实&#xff08;VR&#xff09;技术与智慧城市建设的结合越来越紧密。在消防安全领域&#xff0c;VR技术的应用不仅能够提升消防训练的效率和安全性&#xff0c;还能在智慧消防一体化决策平台中发挥重要作用。本文将探讨“VR智慧消防一体化…

nginx http反向代理

系统&#xff1a;Ubuntu_24.0.4 1、安装nginx sudo apt-get update sudo apt-get install nginx sudo systemctl start nginx 2、配置nginx.conf文件 /etc/nginx/nginx.conf&#xff0c;但可以在 /etc/nginx/sites-available/ 目录下创建一个新的配置文件&#xff0c;并在…

arcgisPro加载CGCS2000天地图后,如何转成米单位

1、导入加载的天地图影像服务&#xff0c;一开始是经纬度显示的。 2、右键地图&#xff0c;选择需要调整的投影坐标&#xff0c;这里选择坐标如下&#xff1a; 3、点击确定后&#xff0c;就可以调整成米单位的了。 4、切换后结果如下&#xff1a; 如有需要&#xff0c;可调整成…

计算机的错误计算(二百零四)

摘要 利用两个大模型判断&#xff1a;在(0, ) 范围内&#xff0c; 和 等价吗&#xff1f;实验表明&#xff0c;两个大模型&#xff08;其中一个是数学大模型&#xff09;均在输出幻觉&#xff0c;均说等价&#xff01; 例1. 在(0, ) 范围内&#xff0c; 和 等价吗&#xf…