mac命令行将输出写入文件_如何在Linux中使用命令行将PDF文件转换为可编辑文本...

mac命令行将输出写入文件

mac命令行将输出写入文件

00_lead_image_pdf_to_text

There are various reasons why you might want to convert a PDF file to editable text. Maybe you need to revise an old document and all you have is the PDF version of it. Converting PDF files in Windows is easy, but what if you’re using Linux?

出于多种原因,您可能希望将PDF文件转换为可编辑的文本。 也许您需要修改一个旧文档,而您所拥有的只是它的PDF版本。 在Windows中转换PDF文件很容易,但是如果使用Linux,该怎么办?

No worries. We’ll show you how to easily convert PDF files to editable text using a command line tool called pdftotext, that is part of the “poppler-utils” package. This tool may already be installed. To check if pdftotext is installed on your system, press “Ctrl + Alt + T” to open a terminal window. Type the following command at the prompt and press “Enter”.

别担心。 我们将向您展示如何使用名为pdftotext的命令行工具轻松地将PDF文件转换为可编辑文本,该工具是“ poppler-utils”软件包的一部分。 该工具可能已经安装。 要检查系统上是否安装了pdftotext,请按“ Ctrl + Alt + T”打开终端窗口。 在提示符下键入以下命令,然后按“ Enter”。

dpkg –s poppler-utils

dpkg –s poppler-utils

NOTE: When we say to type something in this article and there are quotes around the text, DO NOT type the quotes, unless we specify otherwise.

注意:当我们说要在本文中键入某些内容并且文本周围有引号时,请不要键入引号,除非我们另外指定。

01_checking_for_poppler_utils

If pdftotext is not installed, type the following command at the prompt and press “Enter”.

如果未安装pdftotext,则在提示符下键入以下命令,然后按“ Enter”。

sudo apt-get install poppler-utils

须藤apt-get install poppler-utils

Type your password when prompted and press “Enter”.

出现提示时输入密码,然后按“ Enter”。

02_installing_poppler_utils

There are several tools available in the poppler-utils package for converting PDF to different formats, manipulating PDF files, and extracting information from files.

poppler-utils软件包中提供了几种工具,可用于将PDF转换为不同格式,处理PDF文件以及从文件中提取信息。

03_utilities_in_poppler_utils

The following is the basic command for converting a PDF file to an editable text file. Press “Ctrl + Alt + T” to open a Terminal window, type the command at the prompt, and press “Enter”.

以下是将PDF文件转换为可编辑文本文件的基本命令。 按“ Ctrl + Alt + T”打开“终端”窗口,在提示符下键入命令,然后按“ Enter”。

pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Change the path to each file to correspond to the location and name of your original PDF file and where you want to save the resulting text file. Also, change the filenames to correspond to the names of your files.

更改每个文件的路径,使其与原始PDF文件的位置和名称以及要保存结果文本文件的位置相对应。 另外,更改文件名以对应于文件名。

04_running_pdftotext

The text file is created and can be opened just as you would open any other text file in Linux.

该文本文件已创建并可以打开,就像在Linux中打开任何其他文本文件一样。

05_text_file_created

The converted text may have line breaks in places you don’t want. Line breaks are inserted after every line of text in the PDF file.

转换后的文本可能在您不想要的地方有换行符。 在PDF文件中的每一行文本之后都插入了换行符。

06_converted_text_file_in_editor

You can preserve the layout of your document (headers, footers, paging, etc.) from the original PDF file in the converted text file using the “-layout” flag.

您可以使用“ -layout”标志保留转换后的文本文件中原始PDF文件的文档布局(页眉,页脚,页面等)。

pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

06a_converting_using_layout

If you want to only convert a range of pages in a PDF file, use the “-f” and “-l” (a lowercase “L”) flags to specify the first and last pages in the range you want to convert.

如果只想转换PDF文件中的页面范围,请使用“ -f”和“ -l”(小写的“ L”)标志来指定要转换范围的第一页和最后一页。

pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

07_converting_page_range

To convert a PDF file that’s protected and encrypted with an owner password, use the “-opw” flag (the first character in the flag is a lowercase letter “O”, not a zero).

要转换使用所有者密码保护和加密的PDF文件,请使用“ -opw”标志(标志中的第一个字符是小写字母“ O”,而不是零)。

pdftotext -opw ‘password’ /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

pdftotext -opw'password'/home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Change “password” to the one used to protect the original PDF file being converted. Make sure there are single quotes, not double, around “password”.

将“密码”更改为用于保护要转换的原始PDF文件的密码。 确保在“密码”周围有单引号而不是双引号。

08_converting_pdf_with_password

If the PDF file is protected and encrypted with a user password, use the “-upw” flag instead of the “-opw” flag. The rest of the command is the same.

如果PDF文件受用户密码保护和加密,请使用“ -upw”标志而不是“ -opw”标志。 其余命令相同。

09_converting_pdf_with_user_password

You can also specify the type of end-of-line character that is applied to the converted text. This is especially useful if you plan to access the file on a different operating system like Windows or Mac. To do this, use the “-eol” flag (the middle character in the flag is a lowercase letter “O”, not a zero) followed by a space and the type of end-of-line character you want to use (“unix”, “dos”, or “mac”).

您还可以指定应用于转换后的文本的行尾字符的类型。 如果打算在Windows或Mac等其他操作系统上访问文件,则此功能特别有用。 为此,请使用“ -eol”标志(标志的中间字符是小写字母“ O”,而不是零),后跟一个空格和要使用的行尾字符类型(“ unix”,“ dos”或“ mac”)。

10_converting_pdf_with_eol_format

NOTE: If you don’t specify a filename for the text file, pdftotext automatically uses the base of the PDF filename and adds the “.txt” extension. For example, “file.pdf” will be converted to “file.txt”. If the text file is specified as “-“, the converted text is sent to stdout, which means the text is displayed in the Terminal window and not saved to a file.

注意:如果未为文本文件指定文件名,则pdftotext会自动使用PDF文件名的基础并添加“ .txt”扩展名。 例如,“ file.pdf”将被转换为“ file.txt”。 如果文本文件指定为“-”,则转换后的文本将发送到stdout,这意味着该文本显示在“终端”窗口中,而不保存到文件中。

To close the Terminal window, click the “X” button in the upper-left corner.

要关闭终端窗口,请单击左上角的“ X”按钮。

For more information about the pdftotext command, type “man page pdftotext” at the prompt in a Terminal window.

有关pdftotext命令的更多信息,请在“终端”窗口的提示符下键入“手册页pdftotext”。

翻译自: https://www.howtogeek.com/228531/how-to-convert-a-pdf-file-to-editable-text-using-the-command-line-in-linux/

mac命令行将输出写入文件

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/280726.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Windows Socket和Linux Socket编程的区别

2019独角兽企业重金招聘Python工程师标准>>> 1、一些常用函数的移植 http://www.vckbase.com/document/viewdoc/?id1586 2、网络 socket相关程序从Windows移植到Linux下需要注意的: 1)头文件 Windows下winsock.h/winsock2.h Linux下sys/socket.h 错误处理&…

使用 C# 开发的现代轻量级 Windows 文本编辑器

你好,这里是 Dotnet 工具箱,定期分享 Dotnet 有趣,实用的工具和组件,希望对您有用!Notepads 是一个具有简约设计的现代化轻量级文本编辑器,在 github 上开源,由微软大佬 Jiaqi Liu 开发。开发背…

分布式压测系列之Jmeter4.0第一季

1)Jmeter4.0介绍 jmeter是个纯java编写的开源压测工具,apache旗下的开源软件,一开始是设计为web测试的软件,由于发展迅猛,现在可以压测许多协议比如:http、https、soap、ftp、database数据库、LDAP 轻量目…

Hive学习之路 (一)Hive初识

Hive 简介 什么是Hive 1、Hive 由 Facebook 实现并开源 2、是基于 Hadoop 的一个数据仓库工具 3、可以将结构化的数据映射为一张数据库表 4、并提供 HQL(Hive SQL)查询功能 5、底层数据是存储在 HDFS 上 6、Hive的本质是将 SQL 语句转换为 MapReduce 任务运行 7、使不熟悉 MapR…

os 键盘快捷键截图_如何通过键盘快捷键更有效地使用OS X虚拟桌面

os 键盘快捷键截图() We like having multiple virtual desktops on OS X, especially when we can supercharge them by combining them with a few simple keyboard shortcuts. So, on that note, here are some practical ways to use OS X’s virtual desktops like you me…

旗正规则引擎内存表出错的原因及解决方法

经常我们有一些使用者问到这个问题,关于内存表出错的情况,其实问题不复杂,我这给大家简单的讲一下就明白了,如果还有什么不明白的,其实也都可以问厂家杭州旗正,随时都有人回应的。 1 内存表 1.1 汇总 1.1.1…

Shell脚本之sed的使用

1.sed命令;主要作用是查找;新增 删除 和修改替换。 user.txt daokr#cat user.txt ID Name Sex Age 1 zhang M 19 2 wang G 20 3 cheng M 10 4 huahua M 100 查找命令:-n 和 p(prin…

.NET周报【11月第4期 2022-11-30】

国内文章.NET 7 的 AOT 到底能不能扛反编译?https://www.cnblogs.com/huangxincheng/p/16917197.html在 B 站,公众号上发了一篇 AOT 的文章后,没想到反响还是挺大的,都称赞这个东西能抗反编译,可以让破解难度极大提高&…

HDU 5673 Robot 卡特兰数

题目链接: http://acm.hdu.edu.cn/showproblem.php?pid5673 题目描述: 一个人从原点开始向右走, 要求N秒后回到原点, 且过程中不能到负半轴, 人有两种操作, 走动或者停止, 问总共有多少种方案&…

删除本地账户无法登录电脑_如何从Windows的登录屏幕中删除本地用户帐户

删除本地账户无法登录电脑If you have multiple user accounts on your computer, you might find it annoying to have to click on the icon for your username each time you start up the computer. To remedy this problem, you can hide a user account with a registry …

tarjan算法详解

https://blog.csdn.net/jeryjeryjery/article/details/52829142?locationNum4&fps1 以防链接失效,特此转载此博,如有侵权请见谅 在有向图G中,如果两个顶点间至少存在一条路径,称两个顶点强连通(strongly connected)。如果有向…

Gitlab简单使用CI/CD

开篇语大概是去年就想做这个事情了,奈何当时卡到一个docker命令找不到的问题上,导致文章难产了,墨迹了这么久,终于又有空来捣鼓它了。目的我们要实现的目的是我本地不断提交代码(CI),然后服务器不断进行部署(CD)的一个简单流程。准…

免费的数字图书馆_不仅是书籍:您当地图书馆可能提供的所有免费数字资料

免费的数字图书馆You might think of libraries as old fashioned, or irrelevant in the age of the internet. You’d be wrong. 您可能会认为图书馆是老式的,或者与互联网时代无关。 你会错的。 Modern libraries offer books, yes, but they also provide inter…

iNeuOS工业互联网操作系统,脚本化实现设备运行时长和效率计算与统计

目 录1. 概述... 22. 实时采集开停状态... 23. 增加虚拟设备... 24. 脚本统计和计算设备运行时长... 45. 设备运行时长报表... 71. 概述有一个煤矿项目,使用iNeuOS系统时有一个需要是:要统计设备的运行时长&#xff0c…

C# 图片、文件等加入Project Resources

一、目的 1.编译后,只想有一个exe文件,不想外部文件引用,直接运行exe文件即可。 2.不会出现文件丢失情况。 二、操作 1.右击project ->properties->Resource,左上角选择Image(或其他类型) 2. 点击…

jfinal使用shiro注解大体流程

2019独角兽企业重金招聘Python工程师标准>>> 上一篇答题梳理了jfinal整合shiro的流程,jfinal读取shiro注解,这一篇将作为补充。 1.JFinalShiroPlugin作者为shiro的RequiresRoles,RequiresPermissions, RequiresAuthent…

chrome 快捷键取消_如何使用键盘快捷键在Chrome和Firefox中固定和取消固定选项卡...

chrome 快捷键取消If you tend to open a lot of tabs in your browser, it can become difficult to find the tabs with your most used websites. Pinning tabs in your browser moves those tabs to the left and shrinks the tabs to only show the favicon, and you can …

.NET Conf China 2022参会指南速览(内含超多福利)赶紧预约!⏰⏰⏰

12月充满惊喜各种美好节日纷至沓来似在奖励一年辛苦劳作的你12月的第一波福利.NET Conf China 承包啦立即扫码预约加入.NET年度盛宴抢12月第一波惊喜!.NET Conf China 2022 .NET Conf China 2022是面向开发人员的社区峰会,延续 .NET Conf 2022 的活动&a…

​.Net 7 AOT 彻底解析下(完结篇)

楔子:本篇是承继前面三篇文章而来,分别为:.Net 7 的 AOT 和 CLR有什么区别?.Net 7 的 R2R,Crossgen2是什么?.Net 7 的AOT原理简析通过以上三篇的基础,本篇来彻底解析下AOT这门技术的底层原理。AOT此终,不再…

cmd暂停快捷键_是否有键盘快捷键可以暂停正在运行的CMD窗口的输出?

cmd暂停快捷键When running a batch script, you may need or want to pause the output in the CMD window so that you can look things over. Is there an easy way to pause, then restart the output? Today’s SuperUser Q&A post has the answer to help with a re…