urllib2.URLError: urlopen error [Errno 111] Connection refused

记录个还没解决的问题。下面爬虫代码是可以执行的,但是在我的Ubuntu的虚拟中刚开始是可以运行的,但是,后来不知道改了什么东西,用urllib2写的爬虫和用scrapy 的爬虫代码都不能运行了!!。

import urllib2
import reclass Spider:def __init__(self):self.page = 1self.switch = Truedef loadPage(self):print 'loadPage'url = "http://www.neihan8.com/article/list_5_" + str(self.page) + ".html"headers = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}request = urllib2.Request(url, headers=headers)response = urllib2.urlopen(request)html = response.read()gbk_html = html.decode('gbk').encode('utf-8')pattern = re.compile('<div\sclass="f18 mb20">(.*?)</div>', re.S)content_list = pattern.findall(gbk_html)self.dealPage(content_list)def dealPage(self, content_list):for item in content_list:item = item.replace('<br />', '').replace('<p>', '').replace('</p>', '')self.writePage(item)def writePage(self, item):with open('duanzi.txt', 'a') as f:f.write(item)def startWork(self):while self.switch:self.loadPage()command = raw_input('please enter continue, q back')if command == 'q':self.switch = Falseself.page += 1print '3q use'if __name__ == '__main__':s = Spider()s.startWork()

 爬虫结果

在终端下的错误信息。

Traceback (most recent call last):File "01-neihan.py", line 44, in <module>s.startWork()File "01-neihan.py", line 34, in startWorkself.loadPage()File "01-neihan.py", line 15, in loadPageresponse = urllib2.urlopen(request)File "/usr/lib/python2.7/urllib2.py", line 154, in urlopenreturn opener.open(url, data, timeout)File "/usr/lib/python2.7/urllib2.py", line 429, in openresponse = self._open(req, data)File "/usr/lib/python2.7/urllib2.py", line 447, in _open'_open', req)File "/usr/lib/python2.7/urllib2.py", line 407, in _call_chainresult = func(*args)File "/usr/lib/python2.7/urllib2.py", line 1228, in http_openreturn self.do_open(httplib.HTTPConnection, req)File "/usr/lib/python2.7/urllib2.py", line 1198, in do_openraise URLError(err)
urllib2.URLError: <urlopen error [Errno 111] Connection refused>

出现这个问题之前是我想fangqiang, 所以设置了代理,后来把代理关了也不行。这问题目前还没解决,不知道是Ubuntu的环境问题,还是python的问题。

问题:定位出问题,确实是代理的问题了。

解决办法:

1、首先查看下 /etc/apt/apt.conf,发现里面里面有:

http_proxy="http://192.168.16.109:13128/"
https_proxy="https://192.168.16.109:13128/"

也许内容和我的不一样。然后删除这个文件,然后重启电脑,发现里面还没有解决。

2、查看一下:cat /etc/enviroment,发现有配置

http_proxy="http://192.168.16.109:13128/"
https_proxy="https://192.168.16.109:13128/"

把里面的配置文件删除了,(切记PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games"这一行不要删除,不然Ubuntu开机就不能进入到桌面了)

3、然后重启电脑,执行代码,问题解决。

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/553564.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

springMVC,aop管理log4j,把当前session信息和错误信息打印到日志

((((其实还是不太理解aop的正真意义但是这样可以实现想要的了,我的感觉是执行一个方法时首先通过filter( 这个fiter可以不配置,之所以要他是因为在aop切入的方法session消失了,我们要保存是谁在操作就需要他) > aop管理的log4j类,>log4j 来搞定日志的处理)))) 记录一下…

xp/win 7 系统搭建 Java环境

win 7 系统搭建 Java环境 xp系统大同小异 下面是具体的值

原始servlet+hibernate+struts2,从前台到后台的整个过程

现在三大框架的兴起ssh spring springmvc 基于注解式的编程简单方便了开发,但是让我感觉摸不着头绪,框架固然是好,提高了开发效率, 对企业有很大的帮助,框架封装的一些底层的东西让我不知道为什么要这么做,只知道该这么做,编程的路线肯定是简单快捷,趋势就是随便点点拖拖,就是…

Python 文件操作 'w+' 和 'wb'的区别

在文件上传的时候遇到个问题&#xff0c;就是 w 和 wb 在文件上传的时候是否回车。 根据项目的实景情况模拟一下区别。 首先说一下 w 和 wb 的区别 。w 是文本写入&#xff0c;wb是字节写入。 看代码。首先在window 操作系统下。 1.字节 # utf-8# 模拟上传的文件内容 read…

warnings (imported as 'THREE') was not found in 'three'

这个问题还没解决&#xff01; 用Vue.js 重构项目的时候&#xff0c;引入three.js和其他相关的东西的时候会出现上面的警告。今天就说一下这个解决办法&#xff0c;但是我觉得这个方法不一定适用所有的项目。 一、引入THREE 首先用 npm 安装了 three, 然后再项目里面引入了。…

springMVC实体用注解管理,多对多 set集合元素排序问题 解决

实现效果 分类在set集合里不可排序 现要使商家拥有的相同的分来在同一列,需要把set集合里的元素放入list 但是问题是页面是双循环,必须以 . 的形式取集合元素所以需要把list集合声明到实体中,只做临时存储,所以写到dto类,这样就可排序了 我们用一个内部类Collections 的sort ( …

进栈出栈示意图

进栈出栈示意图 12345 一次进栈 可以是54321,21543,32541等, 原理 : 后进先出,先进后出

浏览器与JavaScript(一)

作为web前端工程师&#xff0c;每天都会使用浏览器&#xff0c;所以就想总结下浏览器的知识&#xff0c;下面开始正文&#xff0c;本文的东西都是拿Chrome浏览器来说的。 浏览器是多进程。 我们先打开浏览器然后打开一个页面&#xff0c;这个时候我们并不清楚浏览器在后台为我…

java方法的重载与覆盖的返回值类型

public class A extends B{//下面的是方法的覆盖&#xff08;重写overRiding&#xff09;public void riding(){System.out.println("this is overRiding ");}//下面两个函数是方法的重载(overLoading)&#xff0c;但是返回值类型不同&#xff0c;可以运行public St…

threejs 局部辉光

首先看一下局部辉光的效果。 困扰很久的问题&#xff0c;终于解决了&#xff01;&#xff01;&#xff01; 具体找到解决的方法是看了这里和这里2。也是看了这两个帖子之后才找到解决方法。 这种辉光效果也是用后期处理方法&#xff0c;大家可以先看官网上的这个例子。 rend…

RTMP 在浏览器端播放

RTSP、RTMP 也有很多在说的。然而我就是总结下我最近在使用RTMP的理解。 首先说一下RTMP协议的定义, 实时消息协议&#xff08;英语&#xff1a;Real-Time Messaging Protocol&#xff0c;缩写RTMP&#xff09;也称实时消息传输协议&#xff0c;是最初由Macromedia为通过互联网…

自定义spring配置文件位置

spring配置文件 springtest.xml 转移位置 看web.xml配置文件位置 <!-- springMVC 配置 --><servlet><servlet-name>springMVC</servlet-name><servlet-class>org.springframework.web.servlet.DispatcherServlet</servlet-class><!--…

maven项目调试debug错误Source not found.

解决方法&#xff1a; 首先要先将正在调试的项目停止&#xff1b;右键项目 -> Debug As -> Debug Configurations ... 在左侧选择项目对应的启动配置 -> 选中Default -> Remove 点击上图中的Add -> 选Java Project -> 选中对应的项目源码 -> OK

利用dos进入mysql数据库操作数据

1.cd到mysql安装目录bin目录 2.输入ip 用户名,密码 3 3.查看数据库实例 4.进入一个实例 5,操作数据

SVN卸载,修复,等问题:依赖服务或组无法启动.(0x8007042c)解决之一

依赖服务或组无法启动.(0x8007042c) 问题解决办法&#xff1a; 点开始-运行-输入regedit 打开注册表 注册表路径HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\services 在下面的列表中&#xff0c;找到winmgmt&#xff08;Windows Management Instrumentation 的服务名称&am…

springmvc框架下的国内地区级联效果(共享一下给学习的小伙伴)

前台页面html <select name"area" id "areaId" οnchange"areaChange();"><option value"-1">--请选择地区--</option><#list configAreaList as configArea ><option value"${configArea.id}"&…

spring(java,js,html) 截图上传

html <#-- 上传头像 测试页 使用imgareaselect 插件 -->最后 上传了这个插件 共学习参考<link rel"stylesheet" type"text/css" href"${frontRes}/imgareaselect/css/imgareaselect-animated.css" /><link rel"styleshee…

实现多个下拉框同一批option,选中其一其他框里去除选中的项(不可选择已选过的项)--js

html 初始化 先把下拉框 satisfactionOptionTList 查出来,以便出发 选中事件 <div class"col-xs-4"> <button type"button" οnclick"resetSatisfaction();" class"btn btn-success btn-sm" style"ba…