python参考文献_[zotero/python]库中参考文献条目删除后,清除残留PDF的脚本

更新:使用 @滏阳河边捉蚯蚓 https://zhuanlan.zhihu.com/p/41297136上获取系统PDF文件和zotero.sqlite文件的代码,在此感谢!

在zotero的library中删除参考文献条目后,有时PDF不会同步删除,尤甚是安装了zotfile插件后,添加参考文献条目后,对应的PDF附件会移动后zotfile指定的目录中,删除条目后PDF也不会同步删除,因此写了个脚本。运行后,如果目录中某个PDF没有对应的参考文献条目,这个PDF就会被转移到备份的文件夹中。

其原理是读取PDF目录中PDF文件的文件名,如a.pdf,b.pdf....,再读取zoter.sqlite文件中的附件目录,如果后者不包括a.pdf,则移动PDF目录中的a.pdf到备份的目录中。

将代码复制为.py文件,如zot.py,在命令提示符下运行:

python zot.py

运行时需要关闭zotero,自己指定选择备份的目录。

如果有多余的PDF,则提示已备份***.pdf到备份目录中。

如果移动错了,将备份文件目录中的文件自己复制回去即可。如果确认无误,再自行删除备份的文件。

# -*- coding: utf-8 -*-
"""
Spyder Editor"""
from __future__ import print_function
from os import walk, remove
import os
import re
import tkinter as tk
from tkinter import filedialog
import shutil #移动或复制文件
import sqlite3
import pandas as pd
import configparser
import shutil
import sysroot = tk.Tk()
root.withdraw()#选择PDF备份的目录
back_dir = filedialog.askdirectory(title = '请选择PDF备份的目录:')try:from pathlib import Path
except ImportError:from pathlib2 import Pathif sys.version_info.major == 2:reload(sys)sys.setdefaultencoding('UTF8')def get_zotfile_dest_and_zotero_data_dirs():'''Get the Zotero data dir and the Zotfile destination dir in PosixPath type'''profile_dirs = {'darwin': Path.home() / 'Library/Application Support/Zotero','linux': Path.home() / '.zotero/zotero','linux2': Path.home() / '.zotero/zotero','win32': Path.home() / 'AppData/Roaming/Zotero/Zotero'}profile_dir = profile_dirs[sys.platform]config = configparser.ConfigParser()config.read('{}'.format(profile_dir / 'profiles.ini'))configs_loc = profile_dir / config['Profile0']['Path'] / 'prefs.js'configs = configs_loc.read_text()zotero_data_pat = re.compile(r'user_pref("extensions.zotero.dataDir", "(?P<zotero_data>.+)");')zotero_data_dir = Path(zotero_data_pat.search(configs).group('zotero_data'))zotfile_dest_pat = re.compile(r'user_pref("extensions.zotfile.dest_dir", "(?P<zotfile_dest>.+)");')zotfile_dest_dir = Path(zotfile_dest_pat.search(configs).group('zotfile_dest'))return zotero_data_dir, zotfile_dest_dirif __name__ == '__main__':#得到zotero数据目录和文件目录zotero_data_dir, zotfile_dest_dir = get_zotfile_dest_and_zotero_data_dirs()list_of_files = [] #文件包含目录files = [] #仅文件名for (dirpath, dirnames, filenames) in walk(zotfile_dest_dir):for file in filenames:if file.endswith('.pdf') == True:list_of_files.append(os.path.join(dirpath, file))files.append(file)#连接数据库zot_sqlite = os.path.join(zotero_data_dir, 'zotero.sqlite')with sqlite3.connect(zot_sqlite) as con:item_att=pd.read_sql_query("SELECT * FROM itemAttachments", con=con)item_path = item_att['path']#生成备份文件目录#当文件不存在时,才创建该文件夹。if not os.path.exists(back_dir):os.mkdir(back_dir)for i in range(len(files)):#如zotero.sqlite的path中不包括文件if not (item_path.str.contains(re.escape(files[i])).any()): #os.remove(list_of_files[i]) #也可以删除文件shutil.move(list_of_files[i], os.path.join(back_dir, files[i]))#移动文件到备份目录print('已备份',files[i],'到',back_dir)

win 10,Deepin 15.11测试通过。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/561127.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java中sql语句怎么把开始和结束时间作为参数写sql查询_JDBC数据库连接怎么操作?...

之前一直听说过JDBC&#xff0c;但从来不知道它是何物的小伙伴们看过来啦&#xff01;一、概述JDBC(Java Data Base Connectivity,java数据库连接)是一种用于执行SQL语句的Java API&#xff0c;可以为多种关系数据库提供统一访问&#xff0c;它由一组用Java语言编写的类和接口组…

spring boot整合shiro继承redis_spring-boot-plus集成Shiro+JWT权限管理

SpringBootShiroJWT权限管理ShiroApache Shiro是一个强大且易用的Java安全框架,执行身份验证、授权、密码和会话管理。使用Shiro的易于理解的API,您可以快速、轻松地获得任何应用程序,从最小的移动应用程序到最大的网络和企业应用程序。三个核心组件&#xff1a;Subject, Secur…

java 整数变负数_一文帮你读懂Java整数的存储原理

前言大家应该都知道&#xff0c;整数包括负数&#xff0c;零&#xff0c;和正数。在Java中&#xff0c;基本类型中byte(8位)、short(16位)、int(32位)、long(64位)属于整数&#xff0c;并且没有无符号数&#xff0c;均是有符号的。对于计算机来说&#xff0c;它只认识二进制&am…

server2019 sqlcmd命令安装_Ubuntu20.04LTS安装MS sql-server2019的方法

在本文中&#xff0c;我将向您展示如何在Ubuntu 20.04 Focal Fossa上安装Microsoft SQL Server。小广告&#xff1a;喜欢网络技术的朋友可以加W信&#xff1a;xfiles_sky一起学习进步。步骤一&#xff1a;更新ubuntu源sudo apt update && sudo apt upgrade步骤二&#…

servlet里面为什么有时候覆_为什么新来的经理强烈推荐?前后端分离知识,学到了...

引言前后端分离这个词相信大家都听过&#xff0c;不知道大家是怎么理解的呢。前阵子看项目的时候&#xff0c;有一段实现硬是没看懂&#xff0c;下面来给大家说一下一段愚蠢的经历哈。(我没正正式式写过前端&#xff0c;所以如果文章有错的地方希望可以在评论区友善交流~)一、交…

lamp 安装 mysql_linux lamp之离线安装mysql

Linux下自己创建目录/tigger上传mysql压缩包到此目录[rootlocalhost tigger]# tar zxvf mysql.tar.gz[rootlocalhost tigger]# cp -r mysql /usr/local/mysql/usr/local/mysql 为安装目录cd /usr/local/mysql[rootlocalhost mysql]# groupadd mysql[rootlocalhost mysql]# user…

microstation添加txt文件_C开发实战-文件操作

文件概述文件几乎无处不在&#xff0c;主要分为磁盘文件和设备文件&#xff0c;典型的磁盘文件有文本文件和二进制文件&#xff0c;磁盘文件存储在外部存储介质(例如磁盘&#xff0c;硬盘&#xff0c;U盘等等)需要加载到内存中才能使用。无论是文本文件还是二进制文件在计算机内…

怎样配置mysql数据源_mysql怎样配置ODBC数据源

选中 sqlserver选择默认连接的数据库 7、配置完成&#xff0c;可以测试连接 扩展资料&#xff1a; spring中配置数据源的几种常见方式&#xff1a;工具/原料 事先配置相应的环境mysql(mysql安装程序)mysql-connector-odbc-3.51.20-win32.exe(mysql数据源dobc安装程序) 步骤/方法…

python开发框架大全_最受欢迎 Top 12 Python 开源框架,你都用过吗?

作者 | 学Python的阿勇责编 | 夕颜出品 | CSDN博客今天给大家带来了12个在GitHub等开源网站中最受欢迎的Python开源框架。如果你正在学习python&#xff0c;那么这12个开源框架&#xff0c;千万别错过&#xff0c;这些框架包括事件I/O&#xff0c;OLAP&#xff0c;Web开发&…

python中的zip是什么意思_Python的zip()函数是什么

zip() 函数可以把两个列表“压缩”成一个 zip 对象(可迭代对象)&#xff0c;这样就可以使用一个循环并行遍历两个列表。为了测试 zip() 函数的功能&#xff0c;我们可以先在交互式解释器中“试验”一下该函数的功能。>>> a [a,b,c]>>> b [1, 2, 3]>>…

python 子线程返回值_python-从线程返回值

python-从线程返回值我如何获得一个线程以将元组或我选择的任何值返回给Python中的父级&#xff1f;12个解决方案59 votes我建议您在启动线程之前实例化Queue.Queue&#xff0c;并将其作为线程的args之一传递&#xff1a;在线程完成之前&#xff0c;它.puts将其结果作为参数接收…

python实现火车票查询_python实现12306火车票查询器

12306火车票购票软件大家都用过&#xff0c;怎么用Python写一个命令行的火车票查看器&#xff0c;要求在命令行敲一行命令来获得你想要的火车票信息&#xff0c;下面通过本文学习吧。Python火车票查询器接口设置先给这个小应用起个名字吧&#xff0c;既然及查询票务信息&#x…

python字符串用法_笔记:python字符串的使用

Python 没有表示单个字符的字符类型&#xff0c;只有字符串类型str。字符串是用单引号或双引号括起来的一系列字符。单引号表示的字符串中可以包含双引号字符&#xff0c;但不能直接包含单引号字符(否则无法知道字符串的开始和结尾分别在哪里)。同样&#xff0c;双引号表示的字…

new出来的对象怎么回收_JVM的内存模型及垃圾回收算法

1、什么是jvm&#xff1a;虚拟出来的计算机&#xff0c;是jre的一部分&#xff0c;使用jvm是为了支持与操作系统无关&#xff0c;实现跨平台&#xff0c;jvm内部体系结构主要分为三个部分&#xff1a;类加载器子系统&#xff0c;运行时数据区和执行引擎。2、jvm内存区域运行时数…

条令考试小程序辅助器_可以自己编题的答题软件,自定义题库考试出题工具,微信答题小程序...

自制题库自己编题的答题小程序要如何制作&#xff1f;今天给大家介绍下可以自己编题的答题软件&#xff0c;自制题库软件在微信小程序里自己出题&#xff0c;然后给别人来答题。每个人都可以通过这个小程序系统出考题&#xff0c;然后给到别人答题&#xff08;自己、同事、学生…

python36 mysql_python-day36(初识MySQL数据库)

一. MySQL 介绍数据库分类:1. 关系型数据库(RDBMS)Oracle数据库MySQLl数据库MariaDB数据库SQL Server数据库Access数据库其他不常用关系型数据库: DB2,PostgreSQL,Informix,Sybase2. 非关系型数据库(Nosql)NOSQL>>>>> Not Olnly SQL键值(Key-Value)存储数据库me…

python解二元二次方程_寻找两个椭圆的交点(Python)

首先&#xff0c;您应该能够在一个方向上重新缩放椭圆。为此&#xff0c;需要将椭圆的系数计算为二次曲线&#xff0c;重新缩放&#xff0c;然后恢复椭圆的新几何参数&#xff1a;中心、轴、角度。然后你的问题减少到找到从椭圆到原点的距离。要解决最后一个问题&#xff0c;你…

mysql jion 三张_mysql三张表 left join

1.建表和数据学生表DROP TABLE IF EXISTS student;CREATE TABLE student (id int(11) NOT NULL AUTO_INCREMENT,name varchar(30) DEFAULT NULL,classid varchar(30) DEFAULT NULL,PRIMARY KEY (id)) ENGINEInnoDB AUTO_INCREMENT6 DEFAULT CHARSETutf8;-- -------------------…

编写有效用例电子版_软件测试人员必须编写代码吗?

相信每一个刚入门软件测试的小伙伴都会琢磨一个问题&#xff1a;软件测试人员&#xff0c;要不要写代码&#xff1f;其实这个问题同样困扰着已经在测试行业闯荡了几年的测试小司机们。那今天&#xff0c;我就来给大家分析一下~01各种软件测试角色一般而言软件测试大体可以分为两…

mysql sqlserver firstrow=2_将CSV文件导入SQLServer

基于SQL Server的CSV导入1)CSV文件数据可能具有,(逗号)中间(Ex&#xff1a;Description)&#xff0c;那么如何使导入处理这些数据&#xff1f;解如果你用,(逗号)作为分隔符&#xff0c;就无法区分数据中的逗号作为字段终止符和逗号。我会用不同的FIELDTERMINATOR喜欢||..代码看…