python提取图片中的文字写入excel文件,并打包为exe可执行文件

python提取图片数据写入excel,并打包为exe可执行文件

    • 1. 以下面的图片为例
    • 2. python环境需要的依赖包
    • 3. 创建交互式窗口
    • 4. 读取文件夹下的所有文件并提取数据
    • 5. 提取图片中字段的代码
    • 6. 打包代码为exe可执行文件
      • 安装打包依赖文件
      • 运行打包代码

1. 以下面的图片为例

在这里插入图片描述

2. python环境需要的依赖包

import os
import re
import pytesseract
from tkinter import Tk, filedialog
from PIL import Image, ImageOps
import pandas as pd

3. 创建交互式窗口

# 创建Tkinter窗口
root = Tk()
root.withdraw()  # 隐藏主窗口# 弹出选择文件夹对话框
folder_path = filedialog.askdirectory(title='选择图片文件夹')

4. 读取文件夹下的所有文件并提取数据

# 弹出选择文件夹对话框
folder_path = filedialog.askdirectory(title='选择图片文件夹')
# 配置Tesseract路径,如果已配置环境变量则可以省略这步
pytesseract.pytesseract.tesseract_cmd = r'D:\toolsoft\tesseractocr\tesseract.exe'
# 创建一个字典来存储数据
data = {'file name': [],'CBF<30% volume': [],'Tmax>6.0s volume': [],'Mismatch volume': [],'Mismatch ratio': []
}
# 如果用户取消选择,返回空路径
if not folder_path:print('未选择文件夹。')
else:print(f'选择的文件夹路径为:{folder_path}')# 遍历文件夹中的所有文件for filename in os.listdir(folder_path):file_path = os.path.join(folder_path, filename)if os.path.isfile(file_path):# 检查文件是否为图片文件(可以根据实际需求扩展这个条件)if filename.lower().endswith(('.png', '.jpg', '.jpeg', '.bmp', '.gif')):# 打开图片try:image = Image.open(file_path)# 处理图片,例如显示、保存或进行其他操作data = from_fig_get_txt(data, image)data['file name'].append(f"{filename}")# 例如,显示图片# image.show()# 或者进行其他处理,如图像处理、识别等# 这里可以添加你的其他代码逻辑except OSError:print(f'无法打开文件:{file_path}')# 使用pandas将数据写入Exceldf = pd.DataFrame(data)df.to_excel('output.xlsx', index=False)print('提取完成并已写入output.xlsx文件。')

5. 提取图片中字段的代码

def from_fig_get_txt(data, image):# 将彩色图像转换为灰度图像gray_image = ImageOps.grayscale(image)# 使用pytesseract提取图片中的文字text = pytesseract.image_to_string(gray_image, lang='eng')  # chi_sim使用简体中文,'eng'用于英文# 将提取的文字按要求分割或处理lines = text.split('\n')for i, line in enumerate(lines):if 'CBF<30% volume' in line.strip():  # 跳过空行# 使用正则表达式进行匹配# 匹配CBF后面的数据cbf_match = re.search(r'CBF<(\d+%) volume:\s*(\S+)\s*ml', line)if cbf_match:# cbf_percent = cbf_match.group(1)  # 提取CBF的百分比cbf_volume = cbf_match.group(2)  # 提取CBF的体积# print(f"CBF百分比: {cbf_percent}, CBF体积: {cbf_volume} ml")data['CBF<30% volume'].append(f"{cbf_volume} ml")if 'Tmax>6.0s volume' in line.strip():  # 跳过空行# 匹配Tmax后面的数据tmax_match = re.search(r'Tmax>([\d.]+)s.*?volume:\s*([\d.]+)\s*ml', line)if tmax_match:# tmax_value = tmax_match.group(1)  # 提取Tmax的数值tmax_volume = tmax_match.group(2)  # 提取Tmax的体积# print(f"Tmax数值: {tmax_value} s, Tmax体积: {tmax_volume} ml")data['Tmax>6.0s volume'].append(f"{tmax_volume} ml")if 'Mismatch volume' in line.strip():  # 跳过空行# 匹配Mismatch后面的数据Mis_match = re.search(r':\s*(.*)$', line)Mis_volume = Mis_match.group(1)  # 提取Tmax的体积# print(f"Tmax数值: {tmax_value} s, Tmax体积: {tmax_volume} ml")data['Mismatch volume'].append(f"{Mis_volume}")if 'Mismatch ratio' in line.strip():  # 跳过空行# 匹配Mismatch后面的数据Mis_ratio = re.search(r':\s*(.*)$', line)Mis_ratio = Mis_ratio.group(1)  # 提取Tmax的体积# print(f"Tmax数值: {tmax_value} s, Tmax体积: {tmax_volume} ml")data['Mismatch ratio'].append(f"{Mis_ratio}")return data

6. 打包代码为exe可执行文件

安装打包依赖文件

pip install pyinstaller

运行打包代码

pyinstaller --onefile yourpyfile.py

生成的 EXE 文件将在 dist 文件夹中

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/38373.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

入门Salesforce:必须掌握的20+基础专业术语!

Salesforce的发展令人印象深刻。在过去的20年中&#xff0c;Salesforce创建了一个由管理员、开发人员、顾问和用户组成的生态系统&#xff0c;不断颠覆创新CRM&#xff0c;促进平等和多样性。 作为初学者&#xff0c;探索Salesforce领域就像学习一门新语言。Salesforce中有着大…

Postman环境变量秘籍:pm.environment的高级使用指南

&#x1f4d3; Postman环境变量秘籍&#xff1a;pm.environment的高级使用指南 Postman是API开发和测试的强大工具&#xff0c;它提供了丰富的功能来简化和加速开发过程。pm.environment 是Postman中用于管理环境变量的内置对象&#xff0c;它允许你在集合运行时存储和访问环境…

YOLOv8改进 | 卷积模块 | 减少冗余计算和内存访问的PConv【CVPR2023】

秋招面试专栏推荐 &#xff1a;深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转 &#x1f4a1;&#x1f4a1;&#x1f4a1;本专栏所有程序均经过测试&#xff0c;可成功执行&#x1f4a1;&#x1f4a1;&#x1f4a1; 专栏目录 &#xff1a;《YOLOv8改进有效…

Vue3详解

vite和webpack区别 vite vite使用原生ES模块进行开发&#xff0c;无需在编译时将所有代码转换为JS打包&#xff0c;从而提供了更快的热更新和自动刷新功能&#xff1b; vite在开发模式下没有打包步骤&#xff0c;而是利用浏览器的ES Module Imports特性实现按需编译&#xff…

深入分析 Android HTTPS 证书管理策略:设置本地证书、使用系统默认证书和忽略证书

深入分析 Android HTTPS 证书管理策略&#xff1a;设置本地证书、使用系统默认证书和忽略证书 在 Android 应用开发中&#xff0c;确保 HTTPS 请求的安全性至关重要。为实现这一目标&#xff0c;我们可以通过不同的方式来管理 HTTPS 证书。本文将详细探讨三种常见的证书管理策…

【ajax实战08】分页功能

本文章目标&#xff1a;点击上/下一页按钮&#xff0c;实现对应页面的变化 实现基本步骤&#xff1a; 一&#xff1a;保存并设置文章总条数 设置一个全局变量&#xff0c;将服务器返回的数据返回给全局变量 二&#xff1a;点击下一页&#xff0c;做临界值判断&#xff0c;并…

Firefox 编译指南2024 Windows10篇- 编译Firefox(三)

1.引言 在成功获取了Firefox源码之后&#xff0c;下一步就是将这些源码编译成一个可执行的浏览器。编译是开发流程中的关键环节&#xff0c;通过编译&#xff0c;我们可以将源代码转换为可执行的程序&#xff0c;测试其功能&#xff0c;并进行必要的优化和调试。 对于像Firef…

git命令含有中文,终端输出中文乱码的问题

目录 1、[当前代码页] 的936 (ANSI/OEM - 简体中文 GBK) 是导致中文乱码的原因 2、这样会导致什么问题呢&#xff1f; (1) 问题一: 【属性】选项的【字体】无法识别自定义文字样式&#xff0c;【默认值】选项可选自定义字体样式&#xff0c;却无法覆盖【属性】选项 (2) 问题…

品牌推广怎么样?掌握正确做法,让品牌大放异彩!

品牌推广对于初创公司来说是一项至关重要的任务。在市场众多品牌中&#xff0c;如何脱颖而出&#xff0c;是每个品牌方都要考虑的问题。 作为一名手工酸奶品牌的创始人&#xff0c;目前全国复制了100多家门店&#xff0c;我来分享下&#xff0c;如何推广&#xff0c;可以让品牌…

通过shell脚本创建MySQl数据库

通过shell脚本创建数据库 #!/bin/bashserverIP10.1.1.196 SERVER_NAMEecho $serverIP | cut -d . -f4cat<<EOF>db.sql drop database if exists ${SERVER_NAME}_scheduler; drop database if exists ${SERVER_NAME}_kms; drop database if exists ${SERVER_NAME}_uim…

Unity 粒子特效(下)

11、Size over Lifetime(生命周期内大小) 主要用于定义粒子从发射到消亡的整个生命周期内&#xff0c;其大小如何随时间发生变化。通过该模块&#xff0c;可以创建出如烟雾扩散、火焰膨胀等。Separate Axes&#xff1a;当勾选此选项时&#xff0c;可以分别控制粒子在X轴、Y轴和…

自定义控件动画篇(四)ObjectAnimator的使用

ObjectAnimator 是 Android 属性动画框架中的一个重要组件&#xff0c;它允许你针对特定属性的值进行动画处理。与 ValueAnimator 相比&#xff0c;ObjectAnimator 更专注于 UI 组件&#xff0c;可以直接作用于视图的属性&#xff0c;如位置、尺寸、透明度等&#xff0c;而无需…

详细阐述 Spring Boot 的核心概念、优势、开发流程、常见配置以及最佳实践

Spring Boot 是一种基于 Java 的框架&#xff0c;它简化了基于 Spring 的应用开发。通过自动配置和嵌入式服务器等技术&#xff0c;Spring Boot 使得开发者可以快速搭建并运行 Spring 应用。下面&#xff0c;我将详细阐述 Spring Boot 的核心概念、优势、开发流程、常见配置以及…

闭包的不同形式

定义 **闭包&#xff08;closure&#xff09;**是一个函数以及其捆绑的周边环境状态&#xff08;lexical environment&#xff0c;词法环境&#xff09;的引用的组合。换而言之&#xff0c;闭包让开发者可以从内部函数访问外部函数的作用域。在 JavaScript 中&#xff0c;闭包…

【Jetpack】ViewModel使用技巧

ViewModel的基本使用方法&#xff0c;这里不再讲解 ViewModel优点 可以在屏幕旋转之后&#xff0c;仍然保持之前的状态&#xff0c;这样就不用刻意去处理屏幕旋转事件可以轻松实现作用域内的单例模式可以轻松在作用域内进行数据共享 ViewMode使用注意 不能将Activity作为Co…

Centos7修改yum源

安装好系统后&#xff0c;网络能通信&#xff0c;源也没有配置&#xff0c;但是安装软件失败。 解决办法&#xff1a;配置阿里yum源 # curl -o /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-7.repo # yum clean all # yum make cache再次安装软…

AI安全研究滞后?清华专家团来支招

在21世纪的科技浪潮中&#xff0c;人工智能&#xff08;AI&#xff09;无疑是最为耀眼的一抹亮色。随着技术的不断突破&#xff0c;AI正以前所未有的速度融入我们的日常生活&#xff0c;重塑着社会、经济乃至人类文明的面貌。然而&#xff0c;在这股汹涌澎湃的发展洪流中&#…

二分查找1

1. 二分查找&#xff08;704&#xff09; 题目描述&#xff1a; 算法原理&#xff1a; 暴力解法就是遍历数组来找到相应的元素&#xff0c;使用二分查找的解法就是每次在数组中选定一个元素来将数组划分为两部分&#xff0c;然后因为数组有序&#xff0c;所以通过大小关系舍弃…

七天速通javaSE:第五天 数组基础

文章目录 前言一、认识数组二、数组的声明和创建1. 声明数组变量2. 创建数组3. 变量的初始化&#xff08;赋值&#xff09;3.1 静态初始化3.2 动态初始化 3. 示例 三、数组的使用1. 循环1.1 普通for循环1.2 For-Each 循环 2. 数组作为函数的参数和返回值 前言 本文将为大家介绍…

Win11 Python3.10 安装pytorch3d

0&#xff0c;背景 Python3.10、cuda 11.7、pytorch 2.0.1 阅读【深度学习】【三维重建】windows10环境配置PyTorch3d详细教程-CSDN博客 1&#xff0c;解决方法 本来想尝试&#xff0c;结果发现CUB安装配置对照表里没有cuda 11.7对应的版本&#xff0c;不敢轻举妄动&#x…