linux chrome 安装过程记录

最近,由于公司需要做爬虫抓取一些新闻,在开发过程中,发现有些网站有一定的反爬措施,通过浏览器访问一切正常,通过其他方式,包括:curl,urlconnection 等,就算加入了cookie,agent等参数也不能完全正常访问,导致爬取失败。

经过网上查找资料,找到解决方案,

对于这种特殊的网站,爬取方式改为通过程序在服务器端打开浏览器,访问地址,然后解析入库。

过程中需要用到chrome浏览器和chromedriver来实现

其中,chrome浏览器支持无界面访问网站,chromedriver,提供java,python,php等语言调用chrome的能力。

现将安装过程记录如下(基于centos6.5,centos7.2 亲测成功):

一、安装chrome

1. 下载安装脚本,

在下载目录中,执行以下命令,将安装脚本下载到本地

wget https://intoli.com/install-google-chrome.sh

2.然后授予可执行权限

chmod 755 ./install-google-chrome.sh

3.执行脚本

./install-google-chrome.sh

安装脚本会自动下载、安装chrome(合适的版本),并且目前两个系统中,所缺少的依赖,都会被安装。

4.测试安装结果

执行命令,  google-chrome-stable --no-sandbox --headless --disable-gpu --screenshot https://www.baidu.com/

如果在当前文件夹中出现screenshot.png  则安装成功

二、安装chromedriver

1.切换到 chrome安装路径 (个人习惯,实际上在什么目录都可以)

cd /opt/google/

2.下载文件包

wget https://npm.taobao.org/mirrors/chromedriver/75.0.3770.90/chromedriver_linux64.zip

3.解压文件包

unzip chromedriver_linux64.zip

解压后,在/opt/google/ 会多出一个文件chromedriver

4.连接文件

ln -s /opt/google/chromedriver /usr/bin/chromedriver

 

 

执行以上命令后,安装成功

 如果文件下载失败,可以下载传上服务器

地址是

https://files.cnblogs.com/files/suntray/install-google-chrome.sh.zip   (安装脚本)

https://files.cnblogs.com/files/suntray/chromedriver_linux64.zip          (驱动文件)

转载于:https://www.cnblogs.com/suntray/p/11136363.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/248601.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

系统带你学习 WebAPIs 第五讲

Web APIs 本篇学习目标: 能够说出常见 offset 系列属性的作用 能够说出常见 client 系列属性的作用 能够说出常见 scroll 系列属性的作用 能够封装简单动画函数 **1.1. **元素偏移量 offset 系列 1.1.1 offset 概述 offset 翻译过来就是偏移量, 我们使用 offset系…

ajax请求相关问题

Ajax中async:false/true的作用: async. 默认是 true,即为异步方式,$.ajax执行后,会继续执行ajax后面的脚本,直到服务器端返回数据后,触发$.ajax里的success方法,这时候执行的是两个线程。 async…

有赞美业微前端的落地总结

2020年4月,有赞美业的前端团队历经7个月时间,完成了美业PC架构从单体SPA到微前端架构的设计、迁移工作。PPT在去年6月份就有了,现在再整理一下形成文章分享给大家。 头图 目录 Part 01 “大话”微前端 微前端是什么 背景 目标 达成价值 …

bcp文件, 逗号文件

bcp 实用工具 https://docs.microsoft.com/zh-cn/sql/tools/bcp-utility?viewsql-server-2017 大容量复制程序实用工具 (bcp) 可以在 Microsoft SQL Server 实例和用户指定格式的数据文件间大容量复制数据。 使用 bcp 实用工具可以将大量新行导入 SQL Server 表,或…

远程登录和复制文件

命令: ssh 对应英文: secure shell 使用: ssh [-P] 用户名ip 优点: 加密和压缩,即安全和提高传输速度 注意: 除了windows系统外的系统默认有ssh客户端,直接使用命令便可; windows系统…

Markdown 编辑器才是yyds|CSDN编辑器测评

前言 今天小编为大家介绍一款编辑器,也正是小编书写这篇文章所使用的Markdown编辑器,正是广大博友想要发布文章的工具。那么 你知道他的都有哪些方便之处么 下面小编带你了解一下 Markdown是什么 Markdown是一种轻量标记语言,通过简单的语法&#xff…

JVM对象已死

(一) 引用计数法 每有一个引用就加1,每失效一个就减1,为0表示可回收;但是此方法无法解决相互引用的情况 (二) 根搜索算法 从一系列的GCRoots对象为起点向下搜索,搜索的路径称为引用链,当一个对象没有任何引…

pcl和opencv多版本共存

pcl和opencv多版本共存 在Ubuntu 16.04系统下安装kinetic版本ROS, 会默认安装opencv 3.3.1和pcl1.7. opencv安装路径/opt/ros/kinetic/ pcl安装路径/usr/ 如果想安装opencv2.4版本,或者安装pcl 1.8版本,那么如何设置安装路径,同时…

45天带你玩转Node(第三天)Node环境安装

本篇目标 能够搭建 Node 运行环境掌握 NodeJS 程序的运行方法理解模块化开发理解系统模块和第三方模块理解package.json文件作用 1.Node 开发概述 1.1为什么要学习服务器端开发技术 前端人员为什么要学习服务器端开发技术? 能够和后端程序员更加紧密的配合网站…

给页面加速,干掉Dom Level 0 Event

现在的web应用越来越复杂,需要响应各种各样的用户触发事件,因而也就不可避免的,需要给我们的html页面上的dom元素增加事件监听函数. 我们知道给dom元素绑定事件监听函数的方法有如下3种: 1 : 页面html: <button onclick”test();”></button>2: 页面html: <bu…

系统带你学习 WebAPIs —— 动画篇(第六讲)

Web APIs 本篇学习目标: 能够封装简单动画函数 能够理解缓动动画的封装 能够使用动画函数 能够写出网页轮播图案例 能够写出移动端触屏事件 1.1. 动画函数封装 1.1.1 缓动效果原理 缓动动画就是让元素运动速度有所变化&#xff0c;最常见的是让速度慢慢停下来 思路&#xff…

Git使用教程:最详细、最傻瓜、最浅显、真正手把手教!(转载学习)

一&#xff1a;Git是什么&#xff1f; Git是目前世界上最先进的分布式版本控制系统。 二&#xff1a;SVN与Git的最主要的区别&#xff1f; SVN是集中式版本控制系统&#xff0c;版本库是集中放在中央服务器的&#xff0c;而干活的时候&#xff0c;用的都是自己的电脑&#xff0…

有些话别不当回事

1、别跟堕落的人比堕落。堕落起来非常容易&#xff0c;可是堕落后再想回到不堕落&#xff0c;难。不要给自己颓废的机会。 2、不要以为躲在学校里就可以忽略外面世界的残酷现实。竞争越来越激烈&#xff1a;人越来越多&#xff0c;职位却越来越少。学校里固然温柔&#xff0c;但…

看完这篇文章保你面试稳操胜券——Vue篇

✨ 进大厂收藏这一系列就够了,全方位搜集总结,为大家归纳出这篇面试宝典,面试途中祝你一臂之力!,共分为四个系列 ✨ 本 篇 为 《 看 完 这 篇 文 章 保 你 面 试 稳 操 胜 券 》 第 一 篇 ( V

梯度下降更新算法

梯度更新是要同时更新&#xff0c;如下图所示&#xff1a;θ0和θ1同时更新&#xff0c;而不是更新完一个后再更新另一个。 学习率α过小&#xff0c;梯度下降较慢&#xff0c;训练时间增长。若学习率α过大&#xff0c;梯度下降会越过最低点&#xff0c;难以得到最优的结果&am…

MangoFix:iOS热修复另辟蹊径

今天向大家介绍的是iOS热修复的另一解决方案&#xff1a;MangoFix。介绍他的原因是他和传统的iOS热修复使用JavaScript bridge 的方式完全不同&#xff0c;MangoFix是一个语法和OC语法非常类似的DSL&#xff0c;其语言本身的设计目标就是为了解决iOS热修复问题&#xff0c;所以…

看完这篇文章保你面试稳操胜券——基础篇(html/css)

✨ 进大厂收藏这一系列就够了,全方位搜集总结,为大家归纳出这篇面试宝典,面试途中祝你一臂之力!,共分为四个系列 ✨ 本 篇 为 《 看 完 这 篇 文 章 保 你 面 试 稳 操 胜 券 》 第 二 篇 ( h

《深入理解Spark-核心思想与源码分析》(四)第四章存储体系

天行健&#xff0c;君子以自强不息&#xff1b;地势坤&#xff0c;君子以厚德载物。——《易经》 本章导读 Spark的初始化阶段、任务提交阶段、执行阶段&#xff0c;始终离不开存储体系。 Spark为了避免Hadoop读写磁盘的I/O操作成为性能瓶颈&#xff0c;优先将配置信息、计算结…

看完这篇文章保你面试稳操胜券 ——(必考题)javaScript 篇

✨ 进大厂收藏这一系列就够了,全方位搜集总结,为大家归纳出这篇面试宝典,面试途中祝你一臂之力!,共分为四个系列 ✨ 本 篇 为 《 看 完 这 篇 文 章 保 你 面 试 稳 操 胜 券 》 第 三 篇 ( j

Django打造大型企业官网-项目部署

Django打造大型企业官网-项目部署 一、准备工作 1、在开发机上的准备工作 1&#xff09;确认项目没有bug。 2&#xff09;打开终端&#xff0c;进入虚拟环境&#xff0c;再 cd 到项目根目录下&#xff0c;执行命令&#xff1a;pip freeze > requirements.txt&#xff0c;将…