python重复元素判定_30段极简Python代码:这些小技巧你都Get了么

选自 | towardsdatascience转自 | 机器之心d69b8cc211753e66d571d22a1b499e53.png

Python 是机器学习最广泛采用的编程语言,它最重要的优势在于编程的易用性。如果读者对基本的 Python 语法已经有一些了解,那么这篇文章可能会给你一些启发。作者简单概览了 30 段代码,它们都是平常非常实用的技巧,我们只要花几分钟就能从头到尾浏览一遍。

1. 重复元素判定

以下方法可以检查给定列表是不是存在重复元素,它会使用 set() 函数来移除所有重复元素。

def all_unique(lst):
    return len(lst) == len(set(lst))
x = [1,1,2,2,3,2,3,4,5,6]
y = [1,2,3,4,5]
all_unique(x) # False
all_unique(y) # True

2. 字符元素组成判定

检查两个字符串的组成元素是不是一样的。

from collections import Counterdef anagram(first, second):return Counter(first) == Counter(second)
anagram("abcd3", "3acdb") # True

3. 内存占用

下面的代码块可以检查变量 variable 所占用的内存。

import sys 
variable = 30 print(sys.getsizeof(variable)) # 24

4. 字节占用

下面的代码块可以检查字符串占用的字节数。

def byte_size(string):return(len(string.encode( utf-8 )))
byte_size( ? ) # 4
byte_size( Hello World ) # 11   

5. 打印 N 次字符串

该代码块不需要循环语句就能打印 N 次字符串。

n = 2; 
s ="Programming"; 
print(s * n);# ProgrammingProgramming  

6. 大写第一个字母

以下代码块会使用 title() 方法,从而大写字符串中每一个单词的首字母。

s = "programming is awesome"
print(s.title())# Programming Is Awesome

7. 分块

给定具体的大小,定义一个函数以按照这个大小切割列表。

from math import ceildef chunk(lst, size):return list(
        map(lambda x: lst[x * size:x * size + size],
            list(range(0, ceil(len(lst) / size)))))
chunk([1,2,3,4,5],2)# [[1,2],[3,4],5]

8. 压缩

这个方法可以将布尔型的值去掉,例如(False,None,0,“”),它使用 filter() 函数。

def compact(lst):return list(filter(bool, lst))
compact([0, 1, False, 2, , 3,  a ,  s , 34])# [ 1, 2, 3,  a ,  s , 34 ]

9. 解包

如下代码段可以将打包好的成对列表解开成两组不同的元组。

array = [[ a ,  b ], [ c ,  d ], [ e ,  f ]]
transposed = zip(*array)
print(transposed)
# [( a ,  c ,  e ), ( b ,  d ,  f )]

10. 链式对比

我们可以在一行代码中使用不同的运算符对比多个不同的元素。

a = 3print( 2 # Trueprint(1 == a # False

11. 逗号连接

下面的代码可以将列表连接成单个字符串,且每一个元素间的分隔方式设置为了逗号。

hobbies = ["basketball", "football", "swimming"]
print("My hobbies are: " + ", ".join(hobbies))# My hobbies are: basketball, football, swimming

12. 元音统计

以下方法将统计字符串中的元音 (‘a’, ‘e’, ‘i’, ‘o’, ‘u’) 的个数,它是通过正则表达式做的。

import redef count_vowels(str):return len(len(re.findall(r [aeiou] , str, re.IGNORECASE)))
count_vowels( foobar ) # 3
count_vowels( gym ) # 0

13. 首字母小写

如下方法将令给定字符串的第一个字符统一为小写。

def decapitalize(string):return str[:1].lower() + str[1:]
decapitalize( FooBar ) #  fooBar
decapitalize( FooBar ) #  fooBar

14. 展开列表

该方法将通过递归的方式将列表的嵌套展开为单个列表。

def spread(arg):
    ret = []for i in arg:if isinstance(i, list):
            ret.extend(i)else:
            ret.append(i)return retdef deep_flatten(lst):
    result = []
    result.extend(
        spread(list(map(lambda x: deep_flatten(x) if type(x) == list else x, lst))))return result
deep_flatten([1, [2], [[3], 4], 5]) # [1,2,3,4,5]

15. 列表的差

该方法将返回第一个列表的元素,其不在第二个列表内。如果同时要反馈第二个列表独有的元素,还需要加一句 set_b.difference(set_a)。

def difference(a, b):
    set_a = set(a)
    set_b = set(b)
    comparison = set_a.difference(set_b)return list(comparison)difference([1,2,3], [1,2,4]) # [3]

16. 通过函数取差

如下方法首先会应用一个给定的函数,然后再返回应用函数后结果有差别的列表元素。

def difference_by(a, b, fn):
    b = set(map(fn, b))return [item for item in a if fn(item) not in b]from math import floor
difference_by([2.1, 1.2], [2.3, 3.4],floor) # [1.2]
difference_by([{  x : 2 }, {  x : 1 }], [{  x : 1 }], lambda v : v[ x ])# [ { x: 2 } ]

17. 链式函数调用

你可以在一行代码内调用多个函数。

def add(a, b):return a + bdef subtract(a, b):return a - b
a, b = 4, 5
print((subtract if a > b else add)(a, b)) # 9 

18. 检查重复项

如下代码将检查两个列表是不是有重复项。

def has_duplicates(lst):
    return len(lst) != len(set(lst))
x = [1,2,3,4,5,5]
y = [1,2,3,4,5]
has_duplicates(x) # True
has_duplicates(y) # False

19. 合并两个字典

下面的方法将用于合并两个字典。

def merge_two_dicts(a, b):
    c = a.copy()   # make a copy of a 
    c.update(b)    # modify keys and values of a with the ones from breturn c
a = {  x : 1,  y : 2}
b = {  y : 3,  z : 4}
print(merge_two_dicts(a, b))# { y : 3,  x : 1,  z : 4}

在 Python 3.5 或更高版本中,我们也可以用以下方式合并字典:

def merge_dictionaries(a, b)return {**a, **b}
a = {  x : 1,  y : 2}
b = {  y : 3,  z : 4}
print(merge_dictionaries(a, b))
# { y : 3,  x : 1,  z : 4}

20. 将两个列表转化为字典

如下方法将会把两个列表转化为单个字典。

def to_dictionary(keys, values):return dict(zip(keys, values))keys = ["a", "b", "c"]    values = [2, 3, 4]print(to_dictionary(keys, values))# { a : 2,  c : 4,  b : 3}

21. 使用枚举

我们常用 For 循环来遍历某个列表,同样我们也能枚举列表的索引与值。

list = ["a", "b", "c", "d"]for index, element in enumerate(list): print("Value", element, "Index ", index, )
# ( Value ,  a ,  Index  , 0)
# ( Value ,  b ,  Index  , 1)
#( Value ,  c ,  Index  , 2)
# ( Value ,  d ,  Index  , 3)    

22. 执行时间

如下代码块可以用来计算执行特定代码所花费的时间。

import time
start_time = time.time()
a = 1
b = 2
c = a + b
print(c) #3
end_time = time.time()
total_time = end_time - start_timeprint("Time: ", total_time)# ( Time:  , 1.1205673217773438e-05)  

23.Try else

我们在使用 try/except 语句的时候也可以加一个 else 子句,如果没有触发错误的话,这个子句就会被运行。

try:2*3except TypeError:
    print("An exception was raised")else:
    print("Thank God, no exceptions were raised.")#Thank God, no exceptions were raised.

24. 元素频率

下面的方法会根据元素频率取列表中最常见的元素。

def most_frequent(list):return max(set(list), key = list.count)list = [1,2,1,2,3,2,1,4,2]
most_frequent(list)  

25. 回文序列

以下方法会检查给定的字符串是不是回文序列,它首先会把所有字母转化为小写,并移除非英文字母符号。最后,它会对比字符串与反向字符串是否相等,相等则表示为回文序列。

def palindrome(string):from re import sub
    s = sub( [W_] , , string.lower())return s == s[::-1]
palindrome( taco cat ) # True

26. 不使用 if-else 的计算子

这一段代码可以不使用条件语句就实现加减乘除、求幂操作,它通过字典这一数据结构实现:

import operator
action = {"+": operator.add,"-": operator.sub,"/": operator.truediv,"*": operator.mul,"**": pow
}
print(action[ - ](50, 25)) # 25

27.Shuffle

该算法会打乱列表元素的顺序,它主要会通过 Fisher-Yates 算法对新列表进行排序:

from copy import deepcopyfrom random import randintdef shuffle(lst):
    temp_lst = deepcopy(lst)
    m = len(temp_lst)while (m):
        m -= 1
        i = randint(0, m)
        temp_lst[m], temp_lst[i] = temp_lst[i], temp_lst[m]return temp_lst
foo = [1,2,3]
shuffle(foo) # [2,3,1] , foo = [1,2,3]

28. 展开列表

将列表内的所有元素,包括子列表,都展开成一个列表。

def spread(arg):
    ret = []for i in arg:if isinstance(i, list):
            ret.extend(i)else:
            ret.append(i)return ret
spread([1,2,3,[4,5,6],[7],8,9]) # [1,2,3,4,5,6,7,8,9]

29. 交换值

不需要额外的操作就能交换两个变量的值。

def swap(a, b):return b, a
a, b = -1, 14
swap(a, b) # (14, -1)
spread([1,2,3,[4,5,6],[7],8,9]) # [1,2,3,4,5,6,7,8,9]

30. 字典默认值

通过 Key 取对应的 Value 值,可以通过以下方式设置默认值。如果 get() 方法没有设置默认值,那么如果遇到不存在的 Key,则会返回 None。

d = { a : 1,  b : 2}print(d.get( c , 3)) # 3

参考链接:https://towardsdatascience.com/30-helpful-python-snippets-that-you-can-learn-in-30-seconds-or-less-69bb49204172微信群

bac034f26a28d6b03930c09f94fd9f54.png

Read MorePython 3 入门,看这篇就够了(超全整理)非常实用的 Python 库,推一次火一次Pandas 常用功能详细教程!

End

奶糖猫   

优秀的人都在看   

e58d732747ae416c996ff1c29093154c.pnge3dc27346a53dfc7c418cf7c9159a542.png在看点一下

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/567035.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql主从数据库同步问题_聊聊MySQL主从数据库同步的那些事儿

在linux服务器下测试:主(master)服务器IP:219.223.5.105(对应内网IP:192.168.1.75)从(slave)服务器IP:219.223.5.104(对应内网IP:192.168.1.74)一、修改主服务器master[mysqld]log-binmysql-bin //[必须]启用二进制日…

360浏览器广告太多怎么办_360浏览器如何关闭广告自动推送

点击蓝字关注我们大家是不是在用360浏览器上网的时候经常会跳出广告来,这些广告有些时候是很烦人的,然而这些广告是能够关闭的,现在我们针对360浏览器,介绍如果关闭自动推送的广告。首先在360浏览器的右上方找到三条杠的“大队长”…

linux下php支持mysql_linux下php扩展mysqli的支持 .

mysqli是优化后的mysql,具体的优点baidu下就ok了cd php-5.2.8 在这下面有个ext文件夹里有mysqlicd ext/mysqlilinux下将源码文件编译应该都有configure吧,可这里没有,在我们已经安装php后,php5这个文件夹里的命令目录bin里有一个…

代码合并工具_作为程序员你必须知道的几款代码比较工具

在程序开发的过程中,程序员会经常对源代码以及库文件进行代码对比,在这篇文章里我们向大家介绍几款程序员常用的代码比较工具。WinMergeWinMerge是一款运行于Windows系统下的文件比较和合并工具,使用它可以非常方便地比较多个文档内容&#x…

mysql 修改数据库的数据库_如何更改MySQL数据库的数据库名

展开全部被取消的命令MySQL 之前提供了一个 rename database db_old to db_new 的命令来直接对数据库改名,可能由于实现的功能不完备(比62616964757a686964616fe58685e5aeb931333433653931如,这条命令可能是一个超大的事务,或者是由于之前的表…

powershell设置了权限依旧无法运行脚本_Power Shell折腾记

更多内容可以关注公众号“编程学习杂谈(codingLearning)”或者访问我的博客微软昨天刚刚发布了最新的Terminal图标,对是图标不是软件。对这个最新版的终端个人期待值还是很高的,不仅颜值高而且更好用,不过正式在稳定Wi…

mysql错误回显注入_基于错误回显的SQL注入整理

由于复习,停了好几天,今天换换模式做了一下关于错误回显的ctf题目,首先附上题目:here整理了一下网上的一些关于错误回显的方法,在这里就不带上地址了,请大牛们原谅:P0x00 关于错误回显用我自己的…

delphi中richedit中光标如何定位到最后_嵌入式开发之Linux系统中Vi编辑器的使用

请大家关注点赞&#xff0c;已经完成物联网相关开发&#xff0c;会从硬件层&#xff0c;硬件中间层&#xff0c;传输层&#xff0c;软件中间件(物联网云平台)&#xff0c;APP开发相关博文。首先从嵌入式开发博文开始&#xff01;上一节关于<>。本节关于Linux系统中Vi编辑…

什么是python自动化测试_python已经自动化了,大家一般用什么测试框架?

首先我们需要明白自动化测试框架更倾向于一种设计思想 &#xff0c;这种思想指导工具的使用或者自研开发&#xff0c;并且不是只能使用仅仅一种框架&#xff0c;结合被测系统本身特性一般是选择多种测试框架的组合&#xff0c;来满足测试和设计需求(开发、维护角度)。录制回放测…

nginx会将post请求转为get么_前端角度谈GET与POST的区别

GET与POST 参数&#xff1a;GET传递的参数只能带URL后面&#xff0c;文本格式QueryString&#xff0c;各浏览器一般有长度限制&#xff0c;一般认为是2083&#xff0c;如果有中文字符更短。提交到服务器端的数据量小。参考&#xff1a;https://www.XXX.com.cn/blog/20201021.ht…

js预览本地word文档_Github+docsify打造在线文档

效果图如下预览链接&#xff1a;https://a870439570.github.io/interview-docs快速开始首先先安装好npm和nodejs,这里就不做过多介绍了 自信安装即可 (https://blog.csdn.net/zimushuang/article/details/79715679)安装docsify 推荐安装 docsify-cli 工具&#xff0c;可以方便创…

python创建一个json_如何为Python选择一个更快的JSON库

使用JSON越多, 你就越有可能遇到JSON编码或解码瓶颈。Python的内置库也不错, 但是还有多个更快的JSON库可用: 如何选择使用哪一个呢?事实是&#xff0c;没有一个正确的答案&#xff0c;没有一个最快的JSON库来超越其他所有库:一个“快速的JSON库”对不同的人意味着不同的东西&…

python函数拟合不规则曲线_python 对任意数据和曲线进行拟合并求出函数表达式的三种解决方案...

第一种是进行多项式拟合&#xff0c;数学上可以证明&#xff0c;任意函数都可以表示为多项式形式。具体示例如下。 ###拟合年龄 import numpy as np import matplotlib.pyplot as plt #定义x、y散点坐标 x [10,20,30,40,50,60,70,80] x np.array(x) print(x is :\n,x) num […

mysql myisam 分表_mysql myisam简单分表设计

一般来说&#xff0c;当我们的数据库的数据超过了100w记录的时候就应该考虑分表或者分区了&#xff0c;这次我来详细说说分表的一些方法。目前我所知道的方法都是MYISAM的&#xff0c;INNODB如何做分表并且保留事务和外键&#xff0c;我还不是很了解。首先&#xff0c;我们需要…

python数据结构 树_Python数据结构——AVL树的实现

既然&#xff0c;我们已经证明&#xff0c;保持 AVL 树的平衡将会使性能得到很大的提升&#xff0c;那我们看看如何在程序中向树插入一个新的键值。因为所有的新键是作为叶节点插入树的&#xff0c;而新叶子的平衡因子为零&#xff0c;所以我们对新插入的节点不作调整。不过一旦…

mysql连接规定时区以及编码_springboot项目中使用mysql连接遇到时区timezone问题,和编码encoding问题解决...

springboot项目中使用mysql连接遇到时区timezone问题&#xff0c;和编码encoding问题解决问题原因1.application.properties的设置1.1spring.datasource.driver-class-name1.2spring.datasource.url1.3spring.datasource.url其他问题总结问题原因1.mysql版本问题导致需要时区的…

python课程设计矩阵对角线之和_在python中如何求矩阵对角线上下元素的和?

下面是一个示例案例&#xff0c;演示如何使用嵌套循环在两种情况下求和&#xff1a;matrix [[ij for j in range(4)] for i in range(4)] for row in matrix: print(" ".join(list(map(str,row)))) totalSum 0 for i in range(1,len(matrix)): for j in range(i): …

mysql 中varchar_MYSQL中VARCHAR和CHAR类型

存储引擎存储CHAR或者VARCHAR值的方式在内存中和在磁盘上可能不一样&#xff0c;所以MYSQL服务器从存储引擎读出的值可能需要转换为另一种存储格式VARCHARvarchar类型用于存储可变长字符串。比定长类型更节省空间&#xff0c;因为它仅使用必要的空间。有一种情况例外&#xff0…

python保存图片_python保存网络图片问题

保存图片代码&#xff1a; def getImg(self,img_url_i):img_text login_session.get(img_url_i,headersself.headers,verifyFalse).textimg_soup BeautifulSoup(img_text,lxml)img_jpg img_soup.find_all("img",class_"origin_image zh-lightbox-thumb lazy&…

python安装常见问题_Python常见问题

问题描述: 在linux环境下部署Python项目时常常报错无法找到自己编写的模块解决方案export PYTHONPATH项目路径问题描述:Scrapy防封之settings文件设置解决方案设置动态USER-AGENT安装scrapy-fake-useragent模块在settings.py中添加配置DOWNLOADER_MIDDLEWARES {scrapy.downloa…