第一百一十六期:不能错过!你必须知道的3种重要Python技能

学习Pandas是很棒的体验,学习Numpy也很有趣。但是,你是否过早地开始使用程序库了呢?这也许是因为你还没有意识到pure python的魅力。

作者:读芯术

 学习Pandas是很棒的体验,学习Numpy也很有趣。但是,你是否过早地开始使用程序库了呢?这也许是因为你还没有意识到pure python的魅力。

如果是这样的话,那么这篇文章会对你很有帮助。

本文将介绍几个非常有趣的pure python功能,这些功能是在日常数据科学工作中十分常用的。在整个数据准备阶段都都可以大量地使用它们(大量用于数据清理),甚至在绘制之前也可以使用它们来聚合数据。

希望你也可以将这些技巧运用到项目中。尽管没有运行时的速度或性能优势,但是与从零开始实施此逻辑相比,这将为你节省大量时间。因此,言归正传,让我们来看第一点吧!

1、拉姆达函数(Lambda Functions)

拉姆达函数非常强大。当然,当必须以相同的方式清理多个列时,我们不会使用它,但这并不是经常遇到的情况。通常情况下,每个属性在清理后都需要自己的逻辑。

Lambda函数允许创建“匿名”函数。这基本上意味着可以快速生成特定函数,而无需使用pythonsdef来正确定义函数。

尽管如此,请记住Lambda函数主要被设计成one-liners,因此它应该用于简单的东西。对于更复杂的逻辑,则需要使用常规函数。

里将展示两个具体示例,通过这些示例,我们无需为所有项目定义函数,从而可以节省许少时间。虽然第一个示例可能不会在现实中常用,但值得一提。这就是对数字求平方。

#regular function 
def square_number(x): res = x ** 2 return res# lambda function 
square = lambda x: x ** 2# results 
print('square_number(4): {}'.format(square_number(4))) 
print('square lambda: {}'.format(square(4)))>>> square_number(4):16 
>>> square lambda: 16 

上面的代码片段以常规方式和lambda函数的方式完成了相同逻辑的实现。虽然结果是一样的,但是lambda的单行看起来舒服多了!

第二个例子是关于检查数字是偶数或非偶数:

#regular function 
def is_even(x): if x % 2 == 0: return True else: return False # lambda function 
even = lambda x: x % 2 == 0# results 
print('is_even(4): {}'.format(is_even(4))) 
print('is_even(3): {}'.format(is_even(3))) 
print('even(4): {}'.format(even(4))) 
print('even(3): {}'.format(even(3)))>>> is_even(4): True 
>>> is_even(3): False 
>>> even(4): True 
>>> even(3): False 

再一次,同样的逻辑以两种方式实现。你来决定你喜欢哪一个吧。

2、列表解析(List Comprehensions)

简单来说,列表解析使我们可以使用其他符号创建列表。可以将其视为括号内的单行循环。

在做特征工程时,使用列表解析很方便。例如,假设我们在通过分析电子邮件标题来进行垃圾邮件检测,那么我们会想弄明白是否问号会在垃圾邮件中经常出现。如果用列表解析来实现的话,这将是一项非常简单的任务。

就不再进行更多的理论解释了。例子才是最重要的。

这里的例子选择声明一个常规函数,该函数将检查列表中以某个字符(在这种情况下为“ a”)开头的项目。实施后,再用列表解析执行相同的操作。猜猜哪个会写起来更快呢?

lst =['Acer', 'Asus', 'Lenovo', 'HP']# regular function 
def starts_with_a(lst): valids = [] for word in lst: if word[0].lower() == 'a': valids.append(word) return valids # list comprehension 
lst_comp = [word for word in lst if word[0].lower() == 'a']# results 
print('starts_with_a: {}'.format(starts_with_a(lst))) 
print('list_comprehension: {}'.format(lst_comp))>>> starts_with_a:['Acer', 'Asus'] 
>>> list_comprehension: ['Acer', 'Asus'] 

如果是第一次看到这样的方式,语法可能会有点混乱。但是当你每天都在写这样的函数时,它们会越来越吸引你,看你能把多少复杂的东西应用进去。

3、Zip函数

这是在实践中很少看到的内置python方法之一。从数据科学家的角度来看,它使我们能够同时迭代两个或多个列表。在处理日期和时间时,这可以派上用场。

例如,有一个属性表示某个事件的开始时间,而第二个属性表示该事件的结束时间时,为了进一步分析,几乎总是需要计算它们之间的时间差。而到目前为止,zip函数是最简单的方法。

例如,来比较一些虚构公司和虚构地区的一周销售日期:

sales_north= [350, 287, 550, 891, 241, 653, 882] 
sales_south = [551, 254, 901, 776, 105, 502, 976]for s1, s2 in zip(sales_north,sales_south): print(s1 — s2)>>> -201 33 -351 115 136 151 -94 

看看这有多么简单吧。可以应用相同的逻辑同时迭代3个数组,只需要在括号中添加“ s3”和其他一些列表名称即可。

结语

Pure Python真的非常强大。了解其功能后,就不再需要专门的库来存放所有内容了。这将帮助你成为一名更好的程序员。

练习这些技能、掌握它们,并将其应用到日常工作中。无论是仅仅为了娱乐、完成学业还是工作,你都不会后悔的。

阅读目录(置顶)(长期更新计算机领域知识)

阅读目录(置顶)(长期更新计算机领域知识)

阅读目录(置顶)(长期科技领域知识)

歌谣带你看java面试题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/424132.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第一百一十七期:爱上 Go 语言的10个理由

这个月 Go 语言就将迎来它的10岁生日了,于是我们特地列出了10条让你可以开心使用 Go 语言的理由。 作者:4bytes 这个月 Go 语言就将迎来它的10岁生日了,于是我们特地列出了10条让你可以开心使用 Go 语言的理由。 Map 集合/映射默认使用0值 …

第一百一十八期:运行 JavaScript 代码片段的 20 种工具

运行 JavaScript 代码片段的 20 种工具 前端日常开发中,我们使用喜爱的 IDE 调试 JavaScript 代码,比如我喜欢的代码编辑器有两个,Sublime Text 3 和 VS Code,前几年还使用过 Atom,偶尔我们会遇到临时需要快速分享给同…

spring mvc学习(25):Eclipse设置代码自动提示

Eclipse只需几步简单的设置就可以像idea那样代码自动提示了,喜欢的小伙伴可以赶紧动手设置,提升效率。 第一步:打开Eclipse --> Window --> Preferences 第二步:点击Java --> 打开Editor --> 点击Content Assist 第…

spring mvc学习(26):处理数据模型--从表单到controller传输数据

创建maven项目就不说了&#xff0c;需要的找我前面的博客 pom.xml文件 <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation"http://maven.apache.org/POM/4.0.0 http…

第一课 回归问题与应用

本系列是七月算法机器学习课程笔记 文章目录1 不同类型的学习2 基本术语与概念3 线性回归模型3.1 什么是线性回归3.2 损失函数3.3 最小化损失函数-梯度下降3.4 学习率有什么影响3.5 过拟合与欠拟合4 逻辑回归4.1 为什么要有逻辑回归4.2 什么是逻辑回归4.3决策边界线性边界判定非…

[推荐] TechNet 广播 SQL Server 2000完结篇

TechNet中文网络广播在之前已经推出了SQL Server 2000的基础系列和管理专家系列&#xff0c;使广大听众认识并掌握了SQL Server 2000的管理技巧。本次系列作为前两次系列课程的完结篇&#xff0c;将会从性能调优及维护的角度为广大听众提供了一道实用而精致的大餐&#xff0c;本…

spring mvc学习(28):get乱码解决

get请求乱码情况 编写一个RegistServlet处理用户的Get请求数据 View Code 运行结果发现输入中文提交后显示结果为乱码&#xff1a; jsp页面中 <meta http-equiv"content-type" content"text/html; charsetUTF-8">通知浏览器以utf-8解码 get请求…

第二课 决策树与随机森林

本系列是七月算法机器学习课程笔记 文章目录1 从LR到决策树1.1 决策树1.2 决策树的终止条件1.3 决策树划分依据1.3.1 信息熵1.3.2 信息增益1.3.3 ID3模型1.3.4 信息增益率1.3.5 基尼指数1.3.6 信息熵与基尼指数1.3.7 连续值属性2 回归树2.1 回归树构建方法3 从决策树到随机森林…

spring mvc学习(27):处理数据模型--从表单到controller传输数据续

创建maven项目就不说了&#xff0c;需要的找我前面的博客 pom.xml文件 <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation"http://maven.apache.org/POM/4.0.0 http…

第三课 SVM

本系列是七月算法机器学习课程笔记 文章目录1 问题2 key idea 13 key idea 24 key idea 35 key idea46 拉格朗日乘子求解7 核函数的发现学习SVM不要先看数学公式&#xff0c;这样把SVM的精华都丢掉了。学习SVM学习作者是如何构建出这样一个算法的过程。1 问题 无论线性分类、逻…

spring mvc学习(29):modelandview向页面传输数据

创建maven项目就不说了&#xff0c;需要的找我前面的博客 pom.xml文件 <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation"http://maven.apache.org/POM/4.0.0 http…

RESTORE DATABASE命令还原SQLServer 2005 数据库

今天在sqlServer20005 的management studio里使用bak文件还原数据库的时候,总是失败!Restore failed for Server ADANDELI. (Microsoft.SqlServer.Smo)An exception occurred while executing a Transact-SQL statement or batch. (Microsoft.SqlServer.ConnectionInfoThe bac…

第一百一十九期:支付宝历年双十一背后的技术揭秘

和过去10年一样&#xff0c;2019年天猫双11又创造了一个全新的纪录。这个数字背后&#xff0c;是数代支付宝工程师们殚精竭虑、不断突破技术难关。 作者&#xff1a;蚂蚁金服科技 自从有了双十一这个电商节日&#xff0c;很多技术人的生命轨迹都改变了&#xff0c;这种年度高…

第五课 机器学习中的特征工程

本系列是七月算法机器学习课程笔记 文章目录1 特征工程与意义2 数据与特征处理2.1数据采集2.2 数据清洗2.3 数据采样2.4 特征处理2.4.1 数值型2.4.2 类别型2.4.3 时间型2.4.3 文本型2.4.4 统计特征3 特征选择3.1 为什么做特征选择3.2 特征选择的方法3.2.1 过滤型3.2.2 包裹型3.…

局域主机做服务器,安装DNN,外网访问的解决办法

局域主机做服务器,安装DNN&#xff0c;外网访问的解决办法 问题&#xff1a; 如图&#xff1a;局域网主机IIS安装了DotNetNuke 4.0.x版本&#xff0c;设置虚拟目录为&#xff1a;dnn &#xff0c;安装好之后&#xff0c;内网用户通过http://192.168.19.9/dnn访问是没问题…

第一百二十期:终于有篇看的懂的B树文章了!

索引&#xff0c;相信大多数人已经相当熟悉了&#xff0c;很多人都知道 MySQL 的索引主要以 B 树为主&#xff0c;但是要问到为什么用 B 树&#xff0c;恐怕很少有人能把前因后果讲述完整。本文就来从头到尾介绍下数据库的索引。 作者&#xff1a;安静的boy 索引&#xff0c;…

csharp:Nhibernate Procedure with CreateSQLQuery and GetNamedQuery

<?xml version"1.0" encoding"utf-8"?> <hibernate-mapping assembly"Domain" namespace"Domain" xmlns"urn:nhibernate-mapping-2.2"><class name"DuCardType" table"DuCardType" la…

第六课 多算法组合与模型调优

本系列是七月算法机器学习课程笔记 文章目录1 前序工作流程1.1 数据处理1.2 特征工程1.3 模型选择1.4 交叉验证1.5 寻找最佳超参数2 模型优化2.1 模型状态2.2 模型优化12.3 模型优化22.4 模型优化32.5 模型优化4&#xff1a;模型融合2.5.1 bagging2.5.2 staking2.5.3 adaboost2…

第一百二十一期:当新闻报道用上AR 技术,能为读者带来什么?

「有一种名为记忆宫殿的记忆术&#xff0c;要点就是在人脑内建立起虚拟的空间场景&#xff0c;并把各种信息与空间产生联系。如果我们也能为每一起新闻建立起空间的概念&#xff0c;显然也会给读者带来更深刻的印象。」 作者&#xff1a;木斯 大部分新闻都拥有不同的切入视角…

第七章 scikit-learn与机器学习实战

文章目录1 scikit-learn2 一个项目实战2.1 项目目标2.2 划定问题2.3 选择性能指标2.4 核实假设2.5 获取数据2.6 数据探索和可视化、发现规律2.7 为机器学习算法准备数据2.8 选择并且训练模型2.9 模型微调2.10 测试集上测试1 scikit-learn 导航页与算法指南 API&#xff1a;数据…