机器学习-实践:海量文件遍历和简单计算器实现

今日我们分享2个机器学习的实践代码海量文件遍历和简单计算器实现。

海量文件遍历

In [40]

!tree -L 3 ./data/
./data/
├── data19638
│   ├── insects
│   │   └── insects
│   └── insects.zip
└── data55217├── Zebra│   ├── others│   └── zebra crossing└── Zebra.zip7 directories, 2 files

In [41]

import zipfile
def unzip_data(src_path,target_path):# 解压原始数据集,将src_path路径下的zip包解压至target_path目录下if(not os.path.isdir(target_path)):     z = zipfile.ZipFile(src_path, 'r')z.extractall(path=target_path)z.close()unzip_data('data/data19638/insects.zip','data/data19638/insects')
unzip_data('data/data55217/Zebra.zip','data/data55217/Zebra')

In [42]

!tree -L 6 ./data/
17 directories, 2627 files

In [43]

import os"""
通过给定目录,统计所有的不同子文件类型及占用内存
"""
size_dict = {}
type_dict = {}
def get_size_type(path):files = os.listdir(path)for filename in files:temp_path = os.path.join(path, filename)if os.path.isdir(temp_path):# 递归调用函数,实现深度文件名解析get_size_type(temp_path)     elif os.path.isfile(temp_path):# 获取文件后缀type_name=os.path.splitext(temp_path)[1]   #无后缀名的文件if not type_name:type_dict.setdefault("None", 0)type_dict["None"] += 1size_dict.setdefault("None", 0)size_dict["None"] += os.path.getsize(temp_path)# 有后缀的文件else:type_dict.setdefault(type_name, 0)type_dict[type_name] += 1size_dict.setdefault(type_name, 0)# 获取文件大小size_dict[type_name] += os.path.getsize(temp_path)  

In [44]

path= "data/"
get_size_type(path)
for each_type in type_dict.keys():print ("%5s下共有【%5s】的文件【%5d】个,占用内存【%7.2f】MB" %     (path,each_type,type_dict[each_type],\size_dict[each_type]/(1024*1024)))
print("总文件数:  【%d】"%(sum(type_dict.values())))
print("总内存大小:【%.2f】GB"%(sum(size_dict.values())/(1024**3)))
data/下共有【 .png】的文件【  442】个,占用内存【   1.88】MB
data/下共有【 .zip】的文件【    2】个,占用内存【1182.19】MB
data/下共有【.jpeg】的文件【 2183】个,占用内存【1216.01】MB
data/下共有【 .xml】的文件【 1938】个,占用内存【   3.25】MB
总文件数:  【4565】
总内存大小:【2.35】GB

简单计算器实现

抽象出几个函数:

(1)弹栈时计算‘两个数字和运算符组成的算式’结果的函数。

(2)判断元素是数字还是运算符的函数。

(3)把算式处理成列表形式的函数。如:'-1-2*((-2+3)+(-2/2))' 应该处理成:['-1', '-', '2', '*', '(', '(', '-2', '+', '3', ')', '+', '(', '-2', '/', '2', ')', ')'] 。

(4)决策函数,决定应该是入栈,弹栈运算,还是弹栈丢弃。

(5)主函数,遍历算式列表,计算最终结果。

In [2]

import re

传入两个数字,一个运算符,根据运算符不同返回相应结果。即计算加减乘除

In [3]

def calculate(n1, n2, operator):''':param n1: float:param n2: float:param operator: + - * /:return: float'''result = 0if operator == "+":result = n1 + n2if operator == "-":result = n1 - n2if operator == "*":result = n1 * n2if operator == "/":result = n1 / n2return result

In [4]

 # 判断是否是运算符,如果是返回True
def is_operator(e):''':param e: str:return: bool'''opers = ['+', '-', '*', '/', '(', ')']return True if e in opers else False

In [5]

# 将算式处理成列表,解决-是负数还是减号
def formula_format(formula):# 去掉算式中的空格formula = re.sub(' ', '', formula)# 以 '横杠数字' 分割, 其中正则表达式:(\-\d+\.?\d*) 括号内:# \- 表示匹配横杠开头; \d+ 表示匹配数字1次或多次;\.?表示匹配小数点0次或1次;\d*表示匹配数字1次或多次。formula_list = [i for i in re.split('(\-\d+\.?\d*)', formula) if i]# 最终的算式列表final_formula = []for item in formula_list:# 第一个是以横杠开头的数字(包括小数)final_formula。即第一个是负数,横杠就不是减号if len(final_formula) == 0 and re.search('^\-\d+\.?\d*$', item):final_formula.append(item)continueif len(final_formula) > 0:# 如果final_formal最后一个元素是运算符['+', '-', '*', '/', '('], 则横杠数字不是负数if re.search('[\+\-\*\/\(]$', final_formula[-1]):final_formula.append(item)continue# 按照运算符分割开item_split = [i for i in re.split('([\+\-\*\/\(\)])', item) if i]final_formula += item_splitreturn final_formula

In [5]

def decision(tail_op, now_op):''':param tail_op: 运算符栈的最后一个运算符:param now_op: 从算式列表取出的当前运算符:return: 1 代表弹栈运算,0 代表弹运算符栈最后一个元素, -1 表示入栈'''# 定义4种运算符级别rate1 = ['+', '-']rate2 = ['*', '/']rate3 = ['(']rate4 = [')']if tail_op in rate1:if now_op in rate2 or now_op in rate3:# 说明连续两个运算优先级不一样,需要入栈return -1else:return 1elif tail_op in rate2:if now_op in rate3:return -1else:return 1elif tail_op in rate3:if now_op in rate4:return 0   # ( 遇上 ) 需要弹出 (,丢掉 )else:return -1  # 只要栈顶元素为(,当前元素不是)都应入栈。else:return -1

In [6]

def final_calc(formula_list):num_stack = []       # 数字栈op_stack = []        # 运算符栈for e in formula_list:operator = is_operator(e)if not operator:# 压入数字栈# 字符串转换为符点数num_stack.append(float(e))else:# 如果是运算符while True:# 如果运算符栈等于0无条件入栈if len(op_stack) == 0:op_stack.append(e)break# decision 函数做决策tag = decision(op_stack[-1], e)if tag == -1:# 如果是-1压入运算符栈进入下一次循环op_stack.append(e)breakelif tag == 0:# 如果是0弹出运算符栈内最后一个(, 丢掉当前),进入下一次循环op_stack.pop()breakelif tag == 1:# 如果是1弹出运算符栈内最后两个元素,弹出数字栈最后两位元素。op = op_stack.pop()num2 = num_stack.pop()num1 = num_stack.pop()# 执行计算# 计算之后压入数字栈num_stack.append(calculate(num1, num2, op))# 处理大循环结束后 数字栈和运算符栈中可能还有元素 的情况while len(op_stack) != 0:op = op_stack.pop()num2 = num_stack.pop()num1 = num_stack.pop()num_stack.append(calculate(num1, num2, op))return num_stack, op_stack

In [1]

if __name__ == '__main__':formula = input('请输入:\n')# formula = "1 - 2 * ( (60-30 +(-40/5) * (9-2*5/3 + 7 /3*99/4*2998 +10 * 568/14 )) - (-4*3)/ (16-3*2))"print("算式:", formula)formula_list = formula_format(formula)result, _ = final_calc(formula_list)print("计算结果:", result[0])

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/593447.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Docker安装Flarum(开源论坛)

Flarum介绍安装命令 #---------------------------------------------------------- mkdir -p /opt/flarum && cd /opt/flarum #---------------------------------------------------------- docker run -p 8888:8888 --name flarum \ --restartalways \ -v /opt/flar…

2 Windows网络编程

1 基础概念 1.1 socket概念 Socket 的原意是“插座”,在计算机通信领域,socket 被翻译为“套接字”,它是计算机之间进行通信的一种约定或一种方式。Socket本质上是一个抽象层,它是一组用于网络通信的API,包括了一系列…

resetlogs失败故障恢复-ORA-01555---惜分飞

客户数据库resetlogs报错 Tue Dec 19 15:21:23 2023 ALTER DATABASE MOUNT Successful mount of redo thread 1, with mount id 1683789043 Database mounted in Exclusive Mode Lost write protection disabled Completed: ALTER DATABASE MOUNT Tue Dec 19 15:22:01 2023…

scss使用for循环遍历,动态赋值类名并配置不同颜色

需求:后端要传入不同的等级,前端通过等级展示不同的字体颜色,通过scss遍历更有利于动态修改颜色或者增删等级 1.通过 for $i from 1 through 4 定义循环,索引值为i 2.nth($colors, $i) 取出对应的颜色 $colors: #ff0000, #00ff…

Vivado JESD204B与AD9162建立通信实战总结

一、FPGA与AD9162的JESD204B接口 FPGA作为JESD204B接口的发送端,AD9162作为JESD204B接口的接收端。FPGA和AD9162的device clk、SYSREF由同源时钟芯片产生。其中,FPGA和AD9162的divice clk时钟不同,并且FPGA的decive clk等同于JESD204B IP的co…

RK3568驱动指南|第九篇 设备模型-第100章 在总线目录下创建属性文件实验

瑞芯微RK3568芯片是一款定位中高端的通用型SOC,采用22nm制程工艺,搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码,支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU,可用于轻量级人工…

qiankun微服务

官网 📦 基于 single-spa 封装,提供了更加开箱即用的 API。 📱 技术栈无关,任意技术栈的应用均可 使用/接入,不论是 React/Vue/Angular/JQuery 还是其他等框架。 💪 HTML Entry 接入方式,让你接…

如何利用ChatGPT处理文本、论文写作、AI绘图、文献查阅、PPT编辑、编程等

无论是进行代码生成、错误调试还是解决编程难题,ChatGPT都能为您提供实用且高质量的建议和指导,提高编程效率和准确性。此外,ChatGPT是一位出色的合作伙伴,可以为您提供论文写作的支持。它可以为您提供论文结构指导、段落重组建议…

低代码技术:颠覆数据孤岛的技术利器

在当今数据驱动的世界中,数据的价值无可忽视。然而,很多组织面临一个普遍的问题,即数据孤岛。数据孤岛指的是不同部门或系统之间无法有效共享和集成数据的情况。这限制了组织在数据驱动的决策和创新方面的能力。然而,低代码平台的…

关于HarmonyOs的参数传递UI刷新以及List,Grid嵌套数据传递,ui刷新问题总结

最近在学习开发过程中遇见一系列的参数传递以及ui刷新问题,在这里做个总结分享。 以下是在开发过程中遇见的问题: 1.页面与子组件之间的参数传递与UI刷新 2.Builder自定义内部子组件的参数传递与UI刷新 3.Grid与List item发生变化Ui刷新问题 4.List…

uniapp条件判断,在各平台执行不同代码等详解

文章目录 1️⃣ 条件判断1.1 方法支持1.2 写法1.3 js文件写法1.4 vue文件写法1.5 css文件写法1.6 平台名称详解优质资源分享作者:xcLeigh 文章地址:https://blog.csdn.net/weixin_43151418/article/details/135260505 uniapp条件判断,在各平台执行不同代码等详解,uniapp代码…

keil如何查看flash和ram占用情况

Keil MDK编译器下查看占用Flash和SRAM空间大小_keil sdram 1k-CSDN博客 1、如何查看各函数占用内存大小: keil查看使用的内存还剩多少_keil如何查看空间-CSDN博客

陈述式资源管理(2)

命令行。声明式资源管理 三种常见的项目发布方式: 1、蓝绿发布 2、金丝雀发布(灰度发布) 3、滚动发布 应用程序升级,最大困难就是新旧业务之间的切换。立项 --- 定稿 --- 需求发布 --- 开发 --- 测试 --- 发布。测试之后上线…

docker搭建Dinky —— 筑梦之路

简介 Dinky 是一个 开箱即用 、易扩展 ,以 Apache Flink 为基础,连接 OLAP 和 数据湖 等众多框架的 一站式 实时计算平台,致力于 流批一体 和 湖仓一体 的探索与实践。 主要功能 其主要功能如下: 沉浸式 FlinkSQL 数据开发&#x…

【感知机】感知机(perceptron)学习算法的原始形式

感知机( perceptron )是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取1 和-1二值。感知机对应输入空间(特征空间)中将实例划分为正负两类的分离超平面,是一种判别模型。感知机是神经网络与支持向量机的基础…

在Golang中如何配置WebSocket以使用wss

在Golang中配置WebSocket以使用wss(WebSocket over TLS)需要使用TLS(Transport Layer Security)来加密WebSocket连接。以下是一个简单的示例代码,演示了如何在Golang中配置WebSocket以使用wss: package ma…

C#_var

文章目录 一、前言二、隐式类型的局部变量2.1 var和匿名类型2.2 批注 三、总结 一、前言 C#中有一个 var 类型,不管什么类型的变量,都可以用它接收,实属懒人最爱了。 我没有了解过它的底层,甚至没看过它的说明文档,也…

大创项目推荐 深度学习动物识别 - 卷积神经网络 机器视觉 图像识别

文章目录 0 前言1 背景2 算法原理2.1 动物识别方法概况2.2 常用的网络模型2.2.1 B-CNN2.2.2 SSD 3 SSD动物目标检测流程4 实现效果5 部分相关代码5.1 数据预处理5.2 构建卷积神经网络5.3 tensorflow计算图可视化5.4 网络模型训练5.5 对猫狗图像进行2分类 6 最后 0 前言 &#…

Windows10系统打开管理员命令提示符的六种

在Windows10系统的运行过程中,我们常常需要打开管理员命令提示符,打开Windows10系统管理员命令提示符的方法很多,下面总结一下打开Windows10系统管理员命令提示符的方法。 工具/原料 硬件:电脑 操作系统:Windows10 …

.NET国产化改造探索(一)、VMware安装银河麒麟

随着时代的发展以及近年来信创工作和…废话就不多说了,这个系列就是为.NET遇到国产化需求的一个闭坑系列。接下来,看操作。 安装银河麒麟 麒麟系统分银河麒麟和中标麒麟,我选择的是银河麒麟服务器版的,关于如何下载,…