PyPDF2 历史
起源:pyPdf (2005-2010)
2005 年,Mathieu Fenniak推出了 pyPdf,“作为一个 PDF 工具包……”专注于
文档操作:逐页拆分、连接和合并;
文档内省;
页面裁剪;和
文档加密和解密。
PyPI 的最后一个版本是2010 年的pyPdf 1.13 。
PyPDF2 诞生(2011-2016)
2011 年底,在与 Mathieu 等人协商后,Phaseit 在 GitHub 上赞助了 PyPDF2 作为 pyPdf 的一个分支。最初的动力是处理更广泛的输入 PDF 实例;Phaseit 的商业工作经常遇到它需要管理的“野外”PDF 实例(主要是连接和分页),但它们与 PDF 标准的偏差太大,以至于 pyPdf 无法读取它们。PyPDF2 可读取相当广泛的真实世界 PDF 实例。
pyPdf 和 PyPDF2 的目标都不是通用的,即提供所有可能的 PDF 相关功能。请注意,Mariano Reingart 的外观相似的 pyfpdf与ReportLab最具可比性,因为 ReportLab 和 pyfpdf 都强调文档生成。有趣的是,pyfpdf 内置了一个基本的 HTML→PDF 转换器,而 PyPDF2 不了解 HTML。
那么 PyPDF2 到底是关于什么的呢?想一想流行的pdftk。PyPDF2 做 pdftk 做的事,它在你当前的 Python 进程中做,它处理更广泛的变体 PDF 格式 [解释]。PyPDF2 有自己的 FAQ 来回答出现的其他问题。
2012 年 3 月, Reddit /r/python 人群间接而简短地谈论了 PyPDF2。
PyPDF3 和 PyPDF4 (2018 - 2022)
有两种方法可以再次激活 PyPDF2:PyPDF3 和 PyPDF4。
PyPDF3 在 2018 年发布了第一个版本,在 2022 年 2 月发布了最后一个版本。它从未从 PyPDF2 获得用户群。
PyPDF4 在 2018 年只有一个版本。
PyPDF2:重生(2022 年至今)
Martin Thoma 于 2022 年 4 月接管了 PyPDF2 的维护工作。