python源码分析工具_python 域名分析工具实现代码

代码如下:

import sys, urllib

import datetime,time

def getDate():

strday=datetime.datetime.now().__str__()

strday=strday.split()[0]

return strday

#url = "http://www.kingnic.com/list/2009-06-16.txt"

def getUrl(dateStr=None):

baseUrl ="http://www.kingnic.com/list/"

if dateStr:

return baseUrl+dateStr+".txt"

thisDate = getDate();

if not thisDate:

print "Error Date!"

return None;

url = baseUrl+thisDate+".txt"

return url

def getSource(url):

source = urllib.urlopen(url).read()

return source

def save(source,filename="domains.txt"):

fp = open(filename,"w")

fp.write(source)

fp.close()

return True;

def loadList(fileName="domains.txt"):

fp = open("domains.txt","r")

source = fp.readlines()

fp.close()

return source;

def getPrefix(domain):

return domain.split('.')[0]

def getPostfix(domain):

return domain.split('.')[1]

def hasMidLine(domain):

if '-' in domain:

return True

else:

return False

def parser(domains):

max =4

min =0

keyword =('sky','see','job')

result=[]

len_num =0;

mid_line_num =0;

for domain in domains:

prefix = getPrefix(domain)

postfix = getPostfix(domain)

domainlen = len(prefix)

if (domainlen < min) or (domainlen > max):

len_num +=1

continue

if hasMidLine(prefix):

mid_line_num +=1

continue

result.append(domain)

print " log : \n"

print "all: \t",len(domains)

print "len not in [%s,%s] \t: %s"%(max,min,len_num)

print "contain '-' :\t",mid_line_num

print "remain:\t",len(result)

return result;

if __name__ == "__main__":

url = getUrl()

source = getSource(url)

save(source)

domains =loadList()

result = parser(domains)

save("".join(result),"result.txt")

print("\n\n\nfinished!!")

输出文件:

domains.txt : kingnic.com 据当天释放的 域名;

result.txt : 符合过滤条件的域名;

log输出:

all: 55500

len not in [4,0] : 55019

contain '-' : 32

remain: 449

finished!!

对 后缀、长度和有无“-”过滤,过滤条件有点少,其它以后如有需要再加。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/489798.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ubuntu安装完mysql无法登录_Ubuntu安装mysql8后无法登陆怎么解决

设置mysql为无密码启动修改MySQL的登录设置&#xff1a;gedit /etc/my.cnf在[mysqld]的段中加上一句&#xff1a;skip-grant-tables保存并退出重新启动mysqld&#xff0c;清空密码重启mysql&#xff1a; sudo systemctl restart mysql进入mysql&#xff1a;mysql -uroot进入mys…

2019年中国智能制造发展现状及趋势分析报告

来源&#xff1a;前瞻产业研究院未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能&#xff0c;互联网和脑科学交叉研究机构。未来智能实验室的主要工作包括&#xff1a;建立AI智能系统智商评测体系&#xff0c;开展世界人工智能智商评测&#xff1b;开展互联网…

unix网络编程

先来考虑信号处理int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);该函数用来修改收到一个信号时的处理方式。参数act用来指定新处理方式&#xff0c;oldact用来保存先前的处理方式。处理方式保存在一个结构中 struct sigaction {void …

python3异常_python3 异常处理

1、异常基础 在编程过程中为了增加友好性&#xff0c;在程序出现bug时一般不会将错误信息显示给用户&#xff0c;而是现实一个提示的页面&#xff0c;通俗来说就是不让用户看见大黄页&#xff01;&#xff01;&#xff01; try: pass #代码主体 except Exception as e: pass 例…

mysql blackhole引擎_MySQL BlackHole引擎

概念像MyISAM、InnoDB&#xff0c;BlackHole是另一种MySQL引擎&#xff0c;从字面意思来看&#xff0c;其表现就像一个黑洞&#xff0c;只进不出&#xff0c;进来就消失。换句话说&#xff0c;任何往其中写的数据都将丢失&#xff0c;有点像Linux的/dev/null比如一个表test的引…

元学习—Meta Learning的兴起

来源&#xff1a;专知【导读】元学习描述了训练深度神经网络相关的更高级别的元素。在深度学习文献中&#xff0c;“元学习”一词经常表示神经网络架构的自动化设计&#xff0c;经常引用“ AutoML”&#xff0c;“少量学习”或“神经架构搜索”。OpenAI的魔方机器人手的成功源于…

codevs 1021 玛丽卡

题目链接&#xff1a;http://codevs.cn/problem/1021/ 题解&#xff1a; 哦&#xff01;最小值的最大值&#xff01;&#xff01;二分&#xff01;&#xff01;&#xff01;……咳咳…… SPFA算法&#xff0c;邻接表&#xff08;邻接矩阵应该不会炸&#xff0c;懒得试了……&am…

python3 rid1.7.4.2 控制台中文乱码_TL;DR - 有关 Python 2 和 Sublime Text 中文 Unicode 编码问题的分析与理解...

TL;DR 问题背景&#xff1a; 相信很多用 Sublime Text 来写 Python 2 的同学都遇到过以下这个问题&#xff08;例如这位同学 /t/100435 和这位同学/t/163012 &#xff09;&#xff1a; 在 Sublime Text 里用 Cmd (Ctrl) B 运行代码 print u中文&#xff0c;想要打印出 unicode…

条码管理系统mysql_银行通用固定资产条码管理系统

银行通用固定资产条码管理系统固定资产条码管理系统是企业管理中的一个重要组成部分&#xff0c;固定资产具有价值高&#xff0c;使用周期长、管理难度大等特点。针对这些问题&#xff0c;本系统运用计算机及条形码等技术&#xff0c;从而实现固定资产的信息化管理。本系统有如…

Linux用find查找指定文件的操作

一 . 查找当前用户下某个文件 例如 要查找的文件名为 sn_sav20140710 可已使用下面的语句查询 [sinopeclocalhost ~]$ find . -name sn_sav20140710 二.查找指定目录下的文件 这里只需指定目录即可 例如&#xff1a; 例如 要查找的文件名为 sn_sav20140710 可已使用下面的语句查…

服务器行业深度解析:服务器未来需求知多少

来源&#xff1a;国盛证券一、 全球公有云加速渗透叠加企业上云大趋势来临1. 全球云领军收入增速维持高位&#xff0c;Q2 CAPEX 出现恢复信号全球云计算进入甜蜜点&#xff0c;IaaS 市场主导增长。1&#xff09;2017 年 6 月&#xff0c;Morgan Stanley 认为全球云计算行业进入…

海上瓶子下有东西吗_洗衣液瓶子我从来不扔,瓶身这样剪几刀,解决了很多家庭的大烦恼...

洗衣液瓶子相信家家户户都会有&#xff0c;每次用完的空洗衣液瓶你都扔掉了吗&#xff1f;那就太可惜了&#xff0c;卖废品也卖不了几毛钱&#xff0c;我们可以将废弃的洗衣液瓶简单剪几刀&#xff0c;就能够变废为宝了&#xff0c;能够解决很多家庭生活中的大烦恼。今天就教大…

光耦继电器

光耦继电器(光电继电器) AQW282SX 282SZ 280SX 280SZ 284SX 284SZ 212S 212SX 21 2SZ 文章目录 光耦继电器(光电继电器)前言一、光耦继电器是什么二、光耦继电器的类型三、光电耦合器的应用总结前言 光耦继电器在工业控制、通讯、医疗设备、家电及汽车电子等领域得到广泛应…

Java学习网站

黑马: http://bbs.itheima.com/forum.php 考试网站: http://www.nowcoder.com/ 牛客网 比较专业的学习技术网站: http://www.ibm.com/developerworks/cn/java/j-lo-chinesecoding/ 开源中国 : http://www.oschina.net/ 学习网站 : http://iteye.com/ ImportNew : http://www.im…

媒体查询响应式布局的几个尺寸_媒体查询实现响应式布局

本文主要介绍 media 查询的使用。通过媒体查询&#xff0c;在不同的屏幕尺寸下&#xff0c;可以设置不同的样式。以此&#xff0c;可以完美解决不同屏幕适配的问题。话不多说&#xff0c;先来看看效果&#xff1a;CSSmedia screen and (max-width: 400px) {.btn {background-co…

为什么说,我们可能是宇宙中唯一的智慧生命?

来源&#xff1a;原理我们在宇宙中是孤独的吗&#xff1f;这个问题可归结为&#xff1a;智慧究竟是自然选择的一种可能结果&#xff0c;还是一种不太可能的侥幸&#xff1f;显而易见的是&#xff0c;可能的事件可以经常发生&#xff1b;不太可能的事件很少发生&#xff0c;或者…

jeecg输入中文查询导表为空_学术利器—SCI期刊影响因子查询/中文核心期刊查询系统更新...

吐槽想起自己第一次投中文期刊的情形&#xff1a;当时学校最低要求是发表一篇核心级别的期刊论文&#xff0c;但是哪些期刊是核心期刊呢&#xff1f;完全不知道&#xff01;都怎么投稿呢&#xff1f;也完全不知道&#xff01;只能问问周围的同学或者师兄师姐。他们也就知道谁谁…

Python 学习随笔1

在一个列表中&#xff0c;找出重复数组的位置。 比如在列表name [1, 5, 8, 22, 56, 2, 8, 45, 7, 2, 35, 2, 486, 2, 152, 111, 265, 2, 2]中&#xff0c;找出2的位置。 方法1&#xff1a; 流程为&#xff1a; 找到第一个2的位置&#xff0c;然后在2之后的一个数后面切片&…

震撼!15项世界互联网领先科技成果发布,将对你的生活产生什么影响?

来源&#xff1a;浙江发布10月20日下午&#xff0c;世界互联网领先科技成果发布活动在乌镇互联网国际会展中心举行。今年6月&#xff0c;世界互联网大会组委会向全球互联网企业、科研机构、高等院校以及个人征集全球互联网领域的领先科技成果&#xff0c;收到了来自中国、美国、…

python 实例化父类对象_在Python中从现有超类实例化子类

所以我正在与第三方库进行交互,这会引发例外情况,但它基本上都会引发相同的异常(特别是suds.WebFault.但是,有可能从异常引发的数据中确定异常的确切类型.我希望将这个异常抽象为子类化这种类型的异常,即&#xff1a;from suds import WebFaultclass MoreSpecificError(WebFaul…