Python 潮流周刊#29:Rust 会比 Python 慢?!

△请给“Python猫”加星标 ,以免错过文章推送

0ece37a98730bbeecfef368167e4b9f3.jpeg

你好,我是猫哥。这里每周分享优质的 Python、AI 及通用技术内容,大部分为英文。本周刊开源,欢迎投稿[1]。另有电报频道[2]作为副刊,补充发布更加丰富的资讯。

🐱产品推荐

FlowUs 息流是新一代知识管理与协作平台,支持云文档、多维表、文件夹、团队空间,提供 100+ 模板,可用于管理笔记、安排计划、文档协作、制作个人主页等。猫哥邀请你一起用 FlowUs 提升个人生产力:

d7448ca2732a23e31a09c5b835fc9512.png

🦄文章&教程

1、Rust std fs 比 Python 慢!真的吗!?

一篇长文,由一个诡异的问题开始:Rust 写的程序竟然比 Python 慢?!作者在定位根因的过程中,多次得到 Rust 方案比 Python 慢的结果,甚至 C 版本代码也比 Python 的慢!层层深入,用上各种定位手段,最后发现竟然是 AMD CPU 内核的问题!

2、Python 中性能最快的时间戳函数是哪个?[3]

Python 中有哪些获取时间戳的函数?它们的性能表现如何?文章取了 7 种函数进行性能测算,发现 time.time() 是最快的。文章发布后引起了一些争议,于是作者写了第二篇,做了 Win10、WSL2 和 Ubuntu20 的对比,也增加了 Python 3.10 和 3.12 的对比。(附:第二篇性能对比的文章[4]

74d319a01d0129d7d764a7adb5040c38.png
调用50万次所需的时间

3、Python 是 Easy,Go 是 Simple,但 Simple != Easy[5]

Python 简单易用门槛低,因为它把很多复杂的工作交给了解释器,这使得它适合用作原型设计,快速开发应用。Go 语言也简单,但相比 Python 的规则要多一些,性能也更高。作者的建议是同时发挥两者的优势。

4、使用 Numba 提升 pandas.DataFrame.apply 的 C 级别性能[6]

在 Pandas 2.2.0 中,DataFrame.apply 可以指定一个新的 numba 引擎,实现并行化的操作。文章介绍了这个引擎的工作原理、它支持的应用场景及无法做到的事,同时给出了多项性能测试的数据。

5、一份杂乱的 Flask 维护任务清单[7]

作者是 Flask 的维护者之一,列出了一份任务清单,提供给 Flask 的贡献者们方便着手处理。我们多数人没有维护开源项目的经验,或许无法想象项目维护者们要做那一大堆与编码完全无关的事。(题外话:Flask 的 star 数在本周已落后于 FastAPI,失去了 Web 框架第二高 star 的位置)

6、用子解释器运行 Python 并行程序[8]

Python 3.12 开放了子解释器的一个 API,它有什么用呢?子解释器与多线程、多进程有什么区别,它们的性能差距有多少?将子解释器用于 Web 开发,会有什么效果?作者用开发中的 Python 3.13 做了一些实验,结果有惊喜也有程序异常。期待明年真正无-GIL 的 Python 吧!

feacb8c93702e3838904db4416a4fcb5.png
工作负载和执行时间的增长率

7、新的开源库 VS. 旧的开源库 [9]

文章选取了 10 组在 Python 社区很知名的库,同时给出它们相对应的替代库,这里最没争议的估计是 Ruff 替代 Pylint,其它则还有:Taipy/Streamlit、Polars/Pandas、Dask/PySpark、PyTorch/TensorFlow ……

8、在 Pandas 的世界中使用 Polars[10]

Polars 是速度更快、内存效率更高、更易于使用的数据处理库,可作为 Pandas 的替换。但是替换后如何与第三方库更好地集成呢?文章介绍了几种处理方法,实现从 Pandas 到 Polars 的无缝切换。

9、Python 的软关键字有哪些?[11]

软关键字(soft keyword)指的是可以被重新赋值的关键字。作者想利用正则表达式从 Python 最新的语法文件中找出所有的软关键字。最后得知只需下面两行代码就能做到(以下是 Python 3.12 的结果,即现在有 4 个软关键字):

>>> import keyword
>>> keyword.softkwlist
['_', 'case', 'match', 'type']

10、用 Python 实现机器人爸爸[12]

为了应对小孩的提问,作者开发了一个“机器人爸爸”。用到了 Eleven Labs 作声音克隆,用 Picovoice 语音转文字提取唤醒词,最后调用 ChatGPT 接口获取答案。

11、如何(以及如何不)设计 REST API[13]

文章列出了十多项 REST API 的最佳实践规则,解释了规则的含义及实现,另外,作者嘲笑了几家公司被广泛使用的 API,将它们作为规则的反例。

12、如何调试 Asyncio 程序?[14]

文章介绍了几种调试 Asyncio 代码的方法,包括启用它的调试日志、在调试模式下运行事件循环、自定义调试信息等。(附:文章的姊妹篇 如何分析 Asyncio 程序?[15] 分析慢程序和高频函数)

🐿️项目&资源

1、marker:高效将 PDF/EPUB/MOBI 转换为 Markdown[16]

支持将多种文件格式转换为 markdown,可删除页眉/页脚,将方程式转换为 latex,格式化处理代码块和表格,另外也支持多种语言。(star 2.3K)(附:将整本 PDF 版《Think Python》转换后的效果[17]

bc21919fc4172cf60b317c71a1450a5b.png
与Nougat在速度和准确性的对比

2、awesome-django-performance:精选资源,用于分析和优化 Django 项目[18]

这个项目整理了一些库、工具、文章和书籍,主要集中在 profile、数据库、缓存、序列化、任务处理和监测等方面。

3、datamodel-code-generator:将 JSON/YAML 转换为 Pydantic 模型[19]

一个数据模型代码生成器,支持多种输入类型(OpenAPI、JSON、YAML、CSV、Python 字典、GraphQL),输出 Pydantic、dataclass、TypeDict 等类型。(star 2K)

4、fastapi-code-generator:用 openapi 文件创建 FastAPI 程序[20]

它利用 datamodel-code-generator 生成 pydantic 模型,基于 OpenAPI 格式的接口文件,快速生成 FastAPI 项目。支持自定义模板,允许将自定义变量传给自定义模板。

5、kanban-python:终端中的看板应用程序[21]

在命令行窗口中实现的看板应用工具,有漂亮的表格、配置与数据分离、可自动创建任务、可作任务跟踪。

7f33a2d3679bf6d82f487271d10a9205.png
看板应用的示例

6、saq:简单的异步队列[22]

一个基于 Asyncio 和 Redis 之上的简单且高性能的任务队列框架。提供有一个简单的 UI,可查看任务队列、状态及执行详情等信息。

7、pyqtgraph:用于科学/工程应用的数据可视化及 GUI 工具[23]

一个高性能的绘图工具库,利用 Numpy 作数值运算、用 Qt 的 GraphicsView 框架作 2D 显示和 OpenGL 作 3D 显示。(star 3.5K)

8、toga:Python 原生、OS 原生的 GUI 工具包[24]

一个用于创建跨平台桌面应用的 GUI 工具,支持 MacOS、Windows、Linux (GTK)、Android、iOS 和单页 Web 应用。(star 3.9K)

9、autometrics-py:函数级的指标监测工具[25]

它提供了一个装饰器,可检测函数的请求率、错误率和延迟等指标,方便你识别和调试程序的问题。支持用 Prometheus 查询与分析、开箱即用的 Grafana 仪表板、自定义告警、运行开销小。

45137eacb032ed72f112f1ce015d55c2.png

10、compiled:Python 标准库的编译后的变体[26]

Python 中有些标准库是用纯 Python 实现的,可能会成为性能瓶颈。这个项目将经过 mypyc 类型检查的标准库编译成 C 代码版本,比原始版本快 2-4 倍。目前已完成 tomllib 和 difflib,计划中还有 asyncio、urllib、zipfile、argparse 和 uuid。

11、transpyler-gpt:GPT 驱动的 Python 转译器,让代码在旧版本上运行[27]

它借助 GPT 将高版本 Python 代码转译成目标环境的 Python 版本代码,实现向下兼容执行。例如将 Python 3.10+ 的 match-case 代码转译成 if-else 代码,可在更低 Python 版本中执行。

12、clone-voice: 一个带 web 界面的声音克隆工具[28]

支持中文、英文、日语、韩语 4 种语言,可在线从麦克风录制声音。支持文字转语音和语音变声。(star 1.3K)

975e70fabde1f1091a0e5e3b02de0fcb.png
语音克隆演示

🐢播客&视频

1、Talk Python To Me #439:Pixi 一个高性能的包管理器[29]

Pixi 是用 Rust 开发的基于 Conda 的包管理器。

2、Mouse Vs Python #23:与 Charlie Marsh 聊 Ruff Formatter[30]

Ruff 是一个用 Rust 编写的 Python linter+formatter,而且两方面都是性能最快的。

🥂讨论&问题

1、你用 Python 做过最酷的事情是什么?[31]

Reddit 上的热门讨论帖,也有近 700 条评论,需要刷很久才能看完。。。

2、鼓励使用命名参数的语法糖[32]

函数的命名参数提高了可读性,但也可能使代码重复和冗长。作者提出了一个简化变量写法的语法糖,得到了不少核心开发者的支持。

🐼欢迎订阅

  • 微信公众号[33]:除更新周刊外,还发布其它原创作品,并转载一些优质文章。(可加好友,可加读者交流群)

  • 博客[34] 及 RSS[35]:我的独立博客,上面有历年原创/翻译的技术文章,以及从 2009 年以来的一些随笔。

  • Github[36]:你可以获取本周刊的 Markdown 源文件,做任何想做的事!

  • 邮件[37]:在 Substack 上开通的频道,满足你通过邮件阅读时事通讯的诉求。

  • Telegram[38]:除了发布周刊的通知外,我将它视为一个“副刊”,补充发布更加丰富的资讯。

  • Twitter[39]:我的关注列表里有大量 Python 相关的开发者与组织的账号。

参考资料

[1]

投稿: https://github.com/chinesehuazhou/python-weekly

[2]

电报频道: https://t.me/pythontrendingweekly

[3]

Python 中性能最快的时间戳函数是哪个?: https://www.dataroc.ca/blog/most-performant-timestamp-functions-python

[4]

第二篇性能对比的文章: https://www.dataroc.ca/blog/most-performant-timestamp-functions-python-2

[5]

Python 是 Easy,Go 是 Simple,但 Simple != Easy: https://preslav.me/2023/11/27/python-is-easy-golang-is-simple-simple-is-not-easy/

[6]

使用 Numba 提升 pandas.DataFrame.apply 的 C 级别性能: https://labs.quansight.org/blog/unlocking-c-level-performance-in-df-apply

[7]

一份杂乱的 Flask 维护任务清单: https://davidism.com/maintainer-notes/

[8]

用子解释器运行 Python 并行程序: https://tonybaloney.github.io/posts/sub-interpreter-web-workers.html

[9]

新的开源库 VS. 旧的开源库 : https://dev.to/taipy/new-open-source-vs-old-open-source-33k7

[10]

在 Pandas 的世界中使用 Polars: https://pythonspeed.com/articles/polars-pandas-interopability/

[11]

Python 的软关键字有哪些?: https://mathspp.com/blog/til/pythons-soft-keywords

[12]

用 Python 实现机器人爸爸: https://blog.untrod.com/2023/11/robot-dad.html

[13]

如何(以及如何不)设计 REST API: https://github.com/stickfigure/blog/wiki/How-to-(and-how-not-to)-design-REST-APIs

[14]

如何调试 Asyncio 程序?: https://superfastpython.com/debug-asyncio/

[15]

如何分析 Asyncio 程序?: https://superfastpython.com/profile-asyncio-programs/

[16]

marker:高效将 PDF/EPUB/MOBI 转换为 Markdown: https://github.com/VikParuchuri/marker

[17]

转换后的效果: https://github.com/VikParuchuri/marker/blob/master/data/examples/marker/thinkpython.md

[18]

awesome-django-performance:精选资源,用于分析和优化 Django 项目: https://github.com/st3v3nmw/awesome-django-performance

[19]

datamodel-code-generator:将 JSON/YAML 转换为 Pydantic 模型: https://github.com/koxudaxi/datamodel-code-generator

[20]

fastapi-code-generator:用 openapi 文件创建 FastAPI 程序: https://github.com/koxudaxi/fastapi-code-generator

[21]

kanban-python:终端中的看板应用程序: https://github.com/Zaloog/kanban-python

[22]

saq:简单的异步队列: https://github.com/tobymao/saq

[23]

pyqtgraph:用于科学/工程应用的数据可视化及 GUI 工具: https://github.com/pyqtgraph/pyqtgraph

[24]

toga:Python 原生、OS 原生的 GUI 工具包: https://github.com/beeware/toga

[25]

autometrics-py:函数级的指标监测工具: https://github.com/autometrics-dev/autometrics-py

[26]

compiled:Python 标准库的编译后的变体: https://github.com/pycompiled/compiled

[27]

transpyler-gpt:GPT 驱动的 Python 转译器,让代码在旧版本上运行: https://github.com/frostming/transpyler-gpt

[28]

clone-voice: 一个带 web 界面的声音克隆工具: https://github.com/jianchang512/clone-voice

[29]

Talk Python To Me #439:Pixi 一个高性能的包管理器: https://talkpython.fm/episodes/show/439/pixi-a-fast-package-manager

[30]

Mouse Vs Python #23:与 Charlie Marsh 聊 Ruff Formatter: https://www.blog.pythonlibrary.org/2023/11/27/episode-23-the-ruff-formatter-with-charlie-marsh/

[31]

你用 Python 做过最酷的事情是什么?: https://www.reddit.com/r/Python/comments/17upt2f/whats_the_coolest_things_youve_done_with_python/

[32]

鼓励使用命名参数的语法糖: https://discuss.python.org/t/syntactic-sugar-to-encourage-use-of-named-arguments/36217

[33]

微信公众号: https://img.pythoncat.top/python_cat.jpg

[34]

博客: https://pythoncat.top

[35]

RSS: https://pythoncat.top/rss.xml

[36]

Github: https://github.com/chinesehuazhou/python-weekly

[37]

邮件: https://pythoncat.substack.com

[38]

Telegram: https://t.me/pythontrendingweekly

[39]

Twitter: https://twitter.com/chinesehuazhou

12b46465b1b30e905305782fe35c0830.gif

如果你觉得本文有帮助

请慷慨分享点赞,感谢啦

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/196615.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据结构】手撕排序NO.1

🔥博客主页: 小羊失眠啦. 🎥系列专栏:《C语言》 《数据结构》 《Linux》《Cpolar》 ❤️感谢大家点赞👍收藏⭐评论✍️ 文章目录 一、排序的概念及其运用1.1 排序的概念1.2 常见的算法排序 二、 冒泡排序三、直接插入排…

【电源专题】什么是电源管理

电源管理为什么重要? 在电子系统和电路的设计中,负载往往需要恒定的电流电压,所以最先考虑的就是电源电路的设计。电源管理所考虑的问题是如何将电源有效分配给系统的不同组件,保障系统不同的负载正常运行。 如电源的输入是交流 (AC) 或直流 (DC)?输入电压是高于或低于输…

RedHat8 安装部署DzzOffice协同办公平台+onlyoffice(docker)以及问题解决(亲测可用,花费2天)

一、基础配置(MysqlDzzoffice) 1:安装软件需要的环境,我们用LAMP的环境。基本上CentOS8自带的软件版本都达到安装DzzOffice的要求。 2:关闭防火墙(不关的话需要开放80端口自行决定)。 systemctl disable --now fire…

HarmonyOS引入其他包,以引入请求axios为例

安装文件 安装文件位置: 总目录的oh-package.json5文件 dependencies:生产环境–上线运行时候必须需要的包 devDependencies:开发环境–开发适合为了方便提高效率的包。 包管理工具 OHPM CLI 作为鸿蒙生态三方库的包管理工具,支持OpenHar…

Facebook引流怎么做?写个脚本就好!

在当今的数字化时代,流量对于任何一个网站或应用程序来说都至关重要,Facebook,作为全球最大的社交网络平台,无疑是一个获取流量的绝佳场所,但是,如何有效地从Facebook引流呢?写个脚本就好了! 在本文中&am…

Python字符串模糊匹配工具:TheFuzz 库详解

更多资料获取 📚 个人网站:ipengtao.com 在处理文本数据时,常常需要进行模糊字符串匹配来找到相似的字符串。Python的 TheFuzz 库提供了强大的方法用于解决这类问题。本文将深入介绍 TheFuzz 库,探讨其基本概念、常用方法和示例代…

什么是Overlay网络?Overlay网络与Underlay网络有什么区别?

你们好,我的网工朋友。 在传统历史阶段,数据中心的网络是以三层架构(核心、汇聚、接入)为基本标准。 但是随着技术的发展,不同的厂家有不同的组建方式,比如说在核心层、汇聚层和接入层增加虚拟化技术。 …

Maven项目目录结构

项目结构 目录说明.ideaIDEA工具的配置文件.mvn用于运行Maven项目src源码文件夹target字节码文件夹.gitignore配置git忽略文件HELP.md自述文件mvnw运行Maven命令(Linux)mvnw.cmd运行Maven命令(Windows)pom.xml依赖管理文件 如图…

从零开始入门Zapier:与ChatGPT双剑合璧,手把手教程让你进入AI与自动化新纪元

coments 1. 1. 打开Zapier的官方界面 登录之后,会出现一个调查表,可以根据自己的情况进行选择。 第一次注册成功,会送你14天的免费体验

经验分享|MySQL分区实战(RANGE)

概述 分区概述 在 MySQL 中, InnoDB存储引擎长期以来一直支持表空间的概念。在 MySQL 8.0 中,同一个分区表的所有分区必须使用相同的存储引擎。但是,也可以为同一 MySQL 服务器甚至同一数据库中的不同分区表使用不同的存储引擎。 通俗地讲…

网络初识:局域网广域网网络通信基础

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、局域网LAN是什么?二、广域网是什么:三. IP地址四.端口号五.认识协议5.1五元组 总结 前言 一、局域网LAN是什么? 局域网…

flask web开发学习之初识flask(三)

文章目录 一、flask扩展二、项目配置1. 直接配置2. 使用配置文件3. 使用环境变量4. 实例文件夹 三、flask命令四、模版和静态文件五、flask和mvc架构 一、flask扩展 flask扩展是指那些为Flask框架提供额外功能和特性的库。这些扩展通常遵循Flask的设计原则,易于集成…

CUDA简介——Grid和Block内Thread索引

1. 引言 前序博客: CUDA简介——基本概念CUDA简介——编程模式CUDA简介——For循环并行化 Thread Index: 每个Thread都有其thread index。 在Kernel中,可通过内置的threadIdx变量来获取其thread index。threadIdx为三维的,有相…

Leetcode每日一题学习训练——Python版(从二叉搜索树到更大和树)

版本说明 当前版本号[20231204]。 版本修改说明20231204初版 目录 文章目录 版本说明目录从二叉搜索树到更大和树理解题目代码思路参考代码 原题可以点击此 1038. 从二叉搜索树到更大和树 前去练习。 从二叉搜索树到更大和树 给定一个二叉搜索树 root (BST),请…

【c++|SDL】二、读取图片、显示图片、动画制作

every blog every motto: You can do more than you think. https://blog.csdn.net/weixin_39190382?typeblog 0. 前言 读取图片,显示图片,动画 SDL中有两种在屏幕上显示的方法 SDL_Surface: 使用软件渲染处理SDL_Texture: 使用硬件加速渲染处理 1.…

iOS代码安全加固利器:深入探讨字符串和代码混淆器的作用

​ 在网上搜“代码混淆”关键词,可以看到n多教程。包括本篇博客,大部分重要内容也是从网上各位大神的博客里面看到然后摘取和总结出来的。虽然网上都有,但是对于我个人来说,很难找到一篇博客概括完全的,所以还是总结一…

现在的00后,实在是太卷了......

现在的小年轻真的卷得过分了。前段时间我们公司来了个00年的,工作没两年,跳槽到我们公司起薪18K,都快接近我了。后来才知道人家是个卷王,从早干到晚就差搬张床到工位睡觉了。 最近和他聊了一次天,原来这位小老弟家里条…

Java中各种数据类型之间的转换

低类型向高类型自动进行转换,高类型向低类型的准换会丢失数据,整数到字符类型的转换将获取对应编码的字符。 进行高精度向低精度的强制类型准换时,需要将想要转换成的数据类型加一个括号()。 如何完成自动转换呢? 转换前的数据类…

KNN算法实战-健康医疗

健康医疗 算法建模 knn 算法建模构建微观数据和疾病之间的关系knn 调整超参数,准确率提升数据归一化、标准化,提升更加明显 算法实战 导入包 import numpy as np import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklea…