C#语言实现PDF转Excel

  • 实现效果

  • 第三方库

ClosedXML

iTextSharp

  • 实现源码

using System.Text;
using iTextSharp.text.pdf;
using iTextSharp.text.pdf.parser;
using System.Text.RegularExpressions;
using ClosedXML.Excel;namespace PdfToExcel_winform
{public partial class MainForm : Form{public MainForm(){InitializeComponent();}private void Form1_Load(object sender, EventArgs e){DateTime specificDate = new DateTime(9999, 3, 15); // 试用截至日期DateTime currentDate = DateTime.Now; // 获取当前日期和时间if (specificDate < currentDate){AddTextAndScroll("******************************************************************************");                AddTextAndScroll("==========软件试用已到期,请联系软件开发者授权续期==========");AddTextAndScroll("******************************************************************************");button1.Enabled = false;}}private void textBox1_TextChanged(object sender, EventArgs e){AddTextAndScroll("=================程序开始执行,START=================");string pdfPath = textBox1.Text;using (PdfReader reader = new PdfReader(pdfPath)){StringBuilder text = new StringBuilder();for (int i = 1; i <= reader.NumberOfPages; i++){text.Append(PdfTextExtractor.GetTextFromPage(reader, i));}//    richTextBox1.Text = text.ToString();AddTextAndScroll("文件读取完成,原始文件信息:\n" + text.ToString());ReadLine(text.ToString(), pdfPath);}}private void button1_Click(object sender, EventArgs e){if (openFileDialog1.ShowDialog() == DialogResult.OK){// 获取选择的文件路径string selectedFilePath = openFileDialog1.FileName;// 处理文件路径,例如显示在文本框中或标签中textBox1.Text = selectedFilePath;}}private void richTextBox1_TextChanged(object sender, EventArgs e){// richTextBox1.ScrollToCaret();}private void AddTextAndScroll(string text){// 添加文本到RichTextBoxrichTextBox1.AppendText(text + Environment.NewLine);// 滚动到RichTextBox的最后richTextBox1.ScrollToCaret();}private void ReadLine(string text, string path){List<Dictionary<string, string>> dataDictionaryList = new List<Dictionary<string, string>>();using (StringReader reader = new StringReader(text.ToString())){string line, line1;while ((line = reader.ReadLine()) != null){if (line.StartsWith(" ") && line.Length > 5){try{//  AddTextAndScroll("11111:" + line);line = Regex.Replace(line, @"\s+", " ");string[] split = line.Trim().Split(" ");AddTextAndScroll("按行提取有用文件内容:" + string.Join(" ", split));line1 = reader.ReadLine();line1 = Regex.Replace(line1, @"\s+", " ");string[] split1 = line1.Trim().Split(" ");AddTextAndScroll("按行提取有用文件内容:" + string.Join(" ", split1));string total = split1.Last();split1 = split1.Take(split1.Length - 1).ToArray();Dictionary<string, string> dataDictionary = new Dictionary<string, string>();//   AddTextAndScroll(" 长度=====:" + split.Length);dataDictionary.Add("no", split[0]);dataDictionary.Add("sum", split[1]);dataDictionary.Add("desc", string.Join(" ", split1));dataDictionary.Add("xh", split[3]);dataDictionary.Add("price", split[5]);dataDictionary.Add("total", total);AddTextAndScroll("行数据处理完成" );dataDictionaryList.Add(dataDictionary);}catch (Exception ex){AddTextAndScroll("程序出错:" + ex.Message);}}}//调用excel处理逻辑WriteExcel(dataDictionaryList, path);}}private void WriteExcel(List<Dictionary<string, string>> dataDictionaryList, string path){string fileName = System.IO.Path.GetFileNameWithoutExtension(path);string directoryPath = System.IO.Path.GetDirectoryName(path);string excelPath = System.IO.Path.Combine(directoryPath, fileName + ".xlsx");AddTextAndScroll("Excel文件创建完成,文件路径为:" + excelPath);// 创建一个新的Excel文件using (var workbook = new XLWorkbook()){// 添加一个工作表var worksheet = workbook.AddWorksheet("Sheet1");// 数据填充worksheet.Cell(1, 1).Value = "序号";worksheet.Cell(1, 2).Value = "数量";worksheet.Cell(1, 3).Value = "描述";worksheet.Cell(1, 4).Value = "型号";worksheet.Cell(1, 5).Value = "单价";worksheet.Cell(1, 6).Value = "金额";var dataList = dataDictionaryList.ToArray();for (var i = 0; i < dataList.Length; i++) {//worksheet.Cell(i + 2, 1).Value = Convert.ToInt16(dataDictionaryList[i]["no"]);//worksheet.Cell(i + 2, 2).Value = Convert.ToDouble(dataDictionaryList[i]["sum"]);//worksheet.Cell(i + 2, 3).Value = dataDictionaryList[i]["desc"];//worksheet.Cell(i + 2, 4).Value = dataDictionaryList[i]["xh"];//worksheet.Cell(i + 2, 5).Value = dataDictionaryList[i]["price"];//worksheet.Cell(i + 2, 6).Value = Convert.ToDecimal(dataDictionaryList[i]["total"]);worksheet.Cell(i + 2, 1).Value = dataDictionaryList[i]["no"];worksheet.Cell(i + 2, 2).Value = dataDictionaryList[i]["sum"];worksheet.Cell(i + 2, 3).Value = dataDictionaryList[i]["desc"];worksheet.Cell(i + 2, 4).Value = dataDictionaryList[i]["xh"];worksheet.Cell(i + 2, 5).Value = dataDictionaryList[i]["price"];worksheet.Cell(i + 2, 6).Value = dataDictionaryList[i]["total"];AddTextAndScroll($"第{i+1}行数据写入Excel表");}AddTextAndScroll("设置Excel表格列宽自适用");worksheet.Columns().AdjustToContents();worksheet.Column(1).Width = 7;// 保存Excel文件workbook.SaveAs(excelPath);}AddTextAndScroll("开始保存Excel文件");AddTextAndScroll("Excel文件保存完成,文件路径为:" + excelPath);AddTextAndScroll("=================程序执行结束,END=================");}}}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/77968.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何将IDP映射属性添加,到accountToken中 方便项目获取登录人信息

✅ 目标 你想要&#xff1a; 用户通过 IdP 登录&#xff08;SAML 或 OAuth2&#xff09;Keycloak 自动将 IdP 返回的属性&#xff08;如&#xff1a;email、name、role 等&#xff09;映射到用户账户中并把这些属性加入到用户登录返回的 Access Token 中&#xff0c;供业务系…

JSON-RPC远程控制

文章目录 &#x1f310; 一、什么是 JSON-RPC&#xff1f;&#x1f4ec; 二、通信过程1️⃣ 客户端发起请求2️⃣ 服务端处理请求&#xff0c;调用方法&#xff0c;返回结果 &#x1f4d1; 三、重要字段说明&#x1f6e0;️ 四、核心函数与概念&#xff08;结合你的代码&#x…

芝法酱躺平攻略(21)——kafka安装和使用

本节内容比较初级&#xff0c;故接着躺平攻略写 一、官网的下载 1.1 下载解压 首先&#xff0c;去官网下载jar包&#xff0c;放进linux中&#xff0c;解压到对应位置。 我的位置放在/WORK/MIDDLEWARE/kafka/4.0 1.2 常见配置 # 每个topic默认的分片数 num.properties4 # 数…

AutoSAR从概念到实践系列之MCAL篇(二)——Mcu模块配置及代码详解(上)

欢迎大家学习我的《AutoSAR从概念到实践系列之MCAL篇》系列课程,我是分享人M哥,目前从事车载控制器的软件开发及测试工作。 学习过程中如有任何疑问,可底下评论! 如果觉得文章内容在工作学习中有帮助到你,麻烦点赞收藏评论+关注走一波!感谢各位的支持! 根据上一篇内容中…

easypoi 实现word模板导出

特此非常致谢&#xff1a;easypoi实现word模板 基础的可以参考上文&#xff1b; 但是我的需求有一点点不一样。 这是我的模板&#xff1a;就是我的t.imgs 是个list 但是很难过的是easy poi 我弄了一天&#xff0c;我都没有弄出来嵌套list循环怎么输出显示&#xff0c;更难过…

Unity中数据存储_LitJson

文章目录 LitJson一&#xff1a;介绍二&#xff1a;特点三&#xff1a;使用四&#xff1a;注意事项 LitJson 一&#xff1a;介绍 LitJson 是一个专为 .NET 设计的轻量级 JSON 处理库&#xff0c;支持序列化和反序列化 JSON 数据。 二&#xff1a;特点 快速且轻量 无外部依赖…

2025年首届人形机器人半程马拉松比赛(附机器人照片)

2025年4月19日&#xff0c;北京亦庄半程马拉松暨人形机器人半场马拉松正式开赛&#xff0c;作为全球首届人形机器人户外跑步成功举办&#xff0c;21.0975公里的户外路程对人形机器人来讲&#xff0c;注定将成为历史性开篇&#xff0c;如果赛事能够持续举办&#xff0c;那举办意…

网络安全职业技能大赛Server2003

通过本地PC中渗透测试平台Kali对服务器场景Windows进⾏系统服务及版本扫描渗透测 试&#xff0c;并将该操作显示结果中Telnet服务对应的端⼝号作为FLAG提交 使用nmap扫描发现目标靶机开放端口232疑似telnet直接进行连接测试成功 Flag&#xff1a;232 通过本地PC中渗透测试平台…

[java八股文][Java基础面试篇]I/O

Java怎么实现网络IO高并发编程&#xff1f; 可以用 Java NIO &#xff0c;是一种同步非阻塞的I/O模型&#xff0c;也是I/O多路复用的基础。 传统的BIO里面socket.read()&#xff0c;如果TCP RecvBuffer里没有数据&#xff0c;函数会一直阻塞&#xff0c;直到收到数据&#xf…

Python常用的第三方模块之【jieba库】支持三种分词模式:精确模式、全模式和搜索引擎模式(提高召回率)

Jieba 是一个流行的中文分词Python库&#xff0c;它提供了三种分词模式&#xff1a;精确模式、全模式和搜索引擎模式。精确模式尝试将句子最精确地切分&#xff0c;适合文本分析&#xff1b;全模式则扫描文本中所有可能的词语&#xff0c;速度快但存在冗余&#xff1b;搜索引擎…

QT6 源(37):界面组件的总基类 QWidget 的源码阅读(下,c++ 代码部分)

&#xff08;1&#xff09; QT 在 c 的基础上增加了自己的编译器&#xff0c;以支持元对象系统和 UI 界面设计&#xff0c;有 MOC 、 UIC 等 QT 自己的编译器。本节的源代码里&#xff0c;为了减少篇幅&#xff0c;易于阅读&#xff0c;去除了上篇中的属性部分&#xff0c; 上篇…

rabbitmq-spring-boot-start版本优化升级

文章目录 1.前言2.优化升级内容3.依赖4.使用4.1发送消息代码示例4.2消费监听代码示例4.3 brock中的消息 5.RabbmitMq的MessageConverter消息转换器5.1默认行为5.2JDK 序列化的缺点5.3使用 JSON 进行序列化 6.总结 1.前言 由于之前手写了一个好用的rabbitmq-spring-boot-start启…

git lfs下载大文件限额

起因是用 model.load_state_dict(torch.load())加载pt权重文件时&#xff0c;出现错误&#xff1a;_pickle.UnpicklingError: invalid load key, ‘v’. GPT告诉我&#xff1a;你的 pt 文件不是权重文件&#xff0c;而是模型整体保存&#xff08;或根本不是 PyTorch 文件&#…

什么是RAG?RAG的主要流程是什么?

**RAG(Retrieval-Augmented Generation)**是一种结合检索与生成技术的框架,旨在通过引入外部知识增强生成模型的性能。其核心思想是:在生成文本时,先从外部知识库中检索相关信息,再将检索结果与原始输入结合,作为生成模型的输入,从而提升生成内容的准确性、相关性和信息…

【Rust 精进之路之第13篇-生命周期·进阶】省略规则与静态生命周期 (`‘static`)

系列: Rust 精进之路:构建可靠、高效软件的底层逻辑 作者: 码觉客 发布日期: 2025年4月20日 引言:让编译器“读懂”你的意图——省略的艺术 在上一篇【生命周期入门】中,我们理解了生命周期的必要性——它是 Rust 编译器用来确保引用有效性、防止悬垂引用的关键机制。我…

Python爬虫实战:获取xie程网敦煌酒店数据并分析,为51出行做参考

一、引言 伴随互联网的飞速发展,在线旅游平台成为人们出行预订酒店的重要途径。xie程网作为国内颇具知名度的在线旅游平台,存有丰富的酒店信息。借助爬取xie程网的酒店数据并加以深入分析,能够为用户提供更为精准的酒店推荐,特别是在旅游旺季,如 51 出行期间。本研究致力…

第二十一讲 XGBoost 回归建模 + SHAP 可解释性分析(利用R语言内置数据集)

下面我将使用 R 语言内置的 mtcars 数据集&#xff0c;模拟一个完整的 XGBoost 回归建模 SHAP 可解释性分析 实战流程。我们将以预测汽车的油耗&#xff08;mpg&#xff09;为目标变量&#xff0c;构建 XGBoost 模型&#xff0c;并用 SHAP 来解释模型输出。 &#x1f697; 示例…

PyMC+AI提示词贝叶斯项目反应IRT理论Rasch分析篮球比赛官方数据:球员能力与位置层级结构研究

全文链接&#xff1a;tecdat.cn/?p41666 在体育数据分析领域不断发展的当下&#xff0c;数据科学家们致力于挖掘数据背后的深层价值&#xff0c;为各行业提供更具洞察力的决策依据。近期&#xff0c;我们团队完成了一项极具意义的咨询项目&#xff0c;旨在通过先进的数据分析手…

【android bluetooth 框架分析 03】【Bta 层详解 1】【Bluetooth Application Laye 介绍】

蓝牙协议栈中 Bluetooth Application Layer&#xff08;蓝牙应用层&#xff09;是协议栈核心组成部分&#xff0c;它位于协议栈中间偏上的位置&#xff0c;主要负责将底层 Bluetooth Stack&#xff08;如 L2CAP、AVDTP、RFCOMM、SDP 等&#xff09;与上层 Profile 和 Android F…

单片机获取真实时间的实现方法

单片机获取真实时间&#xff08;即当前的年月日、时分秒等&#xff09;通常需要依赖外部时间源或模块&#xff0c;因为单片机本身没有内置的实时时钟&#xff08;RTC&#xff09;功能。 在 C 语言环境下&#xff0c;单片机获取真实时间通常需要依赖 外部硬件模块&#xff08;如…