自学python从零开始学_新手学习python

自学python从零开始学_新手学习python－从零开始学习

1.学习python

urllib2 常用方法

urlopen(url, data, timeout)

urllib2.Request()

urllib.urlencode()

params = {}

get : url + "?" + params

http:请求分析

User-Agent : 有些服务器或 Proxy 会通过该值来判断是否是浏览器发出的请求

Content-Type : 在使用 REST 接口时，服务器会检查该值，用来确定 HTTP Body 中的内容该怎样解析。

application/xml ：在 XML RPC，如 RESTful/SOAP 调用时使用

application/json ：在 JSON RPC 调用时使用

application/x-www-form-urlencoded ：浏览器提交 Web 表单时使用

在使用服务器提供的 RESTful 或 SOAP 服务时， Content-Type 设置错误会导致服务器拒绝服务

import urllib

import urllib2

url = 'http://www.server.com/login'

user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'

values = {'username' : 'cqc', 'password' : 'XXXX' }

headers = { 'User-Agent' : user_agent }

data = urllib.urlencode(values)

request = urllib2.Request(url, data, headers)

response = urllib2.urlopen(request)

page = response.read()

对付”反盗链”的方式，对付防盗链，服务器会识别headers中的referer是不是它自己，如果不是，有的服务器不会响应，所以我们还可以在headers中加入referer

代理服务器设置

import urllib2

enable_proxy = True

proxy_handler = urllib2.ProxyHandler({"http" : 'http://some-proxy.com:8080'})

null_proxy_handler = urllib2.ProxyHandler({})

if enable_proxy:

opener = urllib2.build_opener(proxy_handler)

else:

opener = urllib2.build_opener(null_proxy_handler)

urllib2.install_opener(opener)

使用DebugLog

import urllib2

httpHandler = urllib2.HTTPHandler(debuglevel=1)

httpsHandler = urllib2.HTTPSHandler(debuglevel=1)

opener = urllib2.build_opener(httpHandler, httpsHandler)

urllib2.install_opener(opener)

response = urllib2.urlopen('http://www.baidu.com')

cookie Cookielib

import urllib2

import cookielib

#声明一个CookieJar对象实例来保存cookie

cookie = cookielib.CookieJar()

#利用urllib2库的HTTPCookieProcessor对象来创建cookie处理器

handler=urllib2.HTTPCookieProcessor(cookie)

#通过handler来构建opener

opener = urllib2.build_opener(handler)

#此处的open方法同urllib2的urlopen方法，也可以传入request

response = opener.open('http://www.baidu.com')

for item in cookie:

print 'Name = '+item.name

print 'Value = '+item.value

保存cookie到文件

import cookielib

import urllib2

#设置保存cookie的文件，同级目录下的cookie.txt

filename = 'cookie.txt'

#声明一个MozillaCookieJar对象实例来保存cookie，之后写入文件

cookie = cookielib.MozillaCookieJar(filename)

#利用urllib2库的HTTPCookieProcessor对象来创建cookie处理器

handler = urllib2.HTTPCookieProcessor(cookie)

#通过handler来构建opener

opener = urllib2.build_opener(handler)

#创建一个请求，原理同urllib2的urlopen

response = opener.open("http://www.baidu.com")

#保存cookie到文件

cookie.save(ignore_discard=True, ignore_expires=True)

从文件中获取Cookie并访问

import cookielib

import urllib2

#创建MozillaCookieJar实例对象

cookie = cookielib.MozillaCookieJar()

#从文件中读取cookie内容到变量

cookie.load('cookie.txt', ignore_discard=True, ignore_expires=True)

#创建请求的request

req = urllib2.Request("http://www.baidu.com")

#利用urllib2的build_opener方法创建一个opener

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))

response = opener.open(req)

print response.read()

BeautifulSoup 类型

Tag

NavigableString

BeautifulSoup

-Comment

遍历文档树

tag 的 .content 属性可以将tag的子节点以列表的方式输出

.children

.descendants 属性可以对所有tag的子孙节点进行递归循环

.strings 获取多个内容

.stripped_strings 可以去除多余空白内容

.parent 父节点

. parents 所有的父节点

.next_sibling .previous_sibling 兄弟节点

.next_siblings .previous_siblings 所有的兄弟节点

10 .next_element .previous_element 前后节点

.next_elements .previous_elements 所有的前后节点

搜索文档树

find_all( name , attrs , recursive , text , **kwargs )

用法类似

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/258419.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

自学python从零开始学_新手学习python－从零开始学习

相关文章

【数据结构】图的深度优先搜索

flex中dispatchEvent的用法(自定义事件) .

菜鸟超级进口大仓618首度亮相！跨境商品也能当日次日达

频域/s域/z域三大变换的发展史及其联系

Tomcat8.0.21登录时忘记用户名和密码

二元隐函数求二阶偏导_在线计算专题(03)：具体、抽象函数的导数、微分与方向导数的计算...

android更换工具链

频域/s域/z域三大变换的性质对比

Java系列（1） JavaEE架构

协整检验r语言代码_R语言时间序列分析实例

pat1043. Is It a Binary Search Tree (25)

微软待办应用更新

出租WiFi到底靠不靠谱？

AD20学习笔记1---元件库的创建

nodejs环境搭建与express安装配置

在vue中实现picker样式_基于Vue实现timepicker

玩玩

总结界面框架_UI_Adapter

AD20学习笔记2---原理图绘制及编译检查

git如何设置master分支的权限_Git 从master 分支拉新分支开发