Java PDFBox 教程展示了如何使用 PDFBox 在 Java 中创建 PDF 文件。
Apache PDFBox 是一个开源 Java 库,可用于创建,渲染,打印,拆分,合并,更改,验证和提取 PDF 文件的文本和元数据。
另一个非常流行的用于处理 PDF 文件的 Java 库称为 iText 。
我们需要为我们的项目添加以下 Maven 依赖项。
在下面的示例中,我们创建一个 PDF 文档并将一些文本写入其中。
该示例将四行内容写入 PDF 文档。
创建一个新的。 默认情况下,文档具有 A4 格式。
创建一个新页面并将其添加到文档中。
要写入 PDF 页面,我们必须创建一个对象。
在和方法之间写入文本。
我们设置字体和文本开头。
我们使用方法开始新的一行文本。 页面的原点位于左下角。
文本使用方法编写。
使用方法,我们移至下一行文本的开头。
下一个示例从 PDF 文件读取文本。
该示例打印 PDF 文档的文本及其大小。
我们从目录加载 PDF 文档。
用于从 PDF 文件提取文本。
下一个示例在 PDF 文档中创建图像。
该示例从目录加载图像,创建新的 PDF 文档,然后将图像添加到页面中。
用于处理 PDFBox 中的图像。
我们得到图像的宽度和高度。
将图像绘制到页面中。
PDF 文档可以包含描述文档本身或文档中某些对象(例如文档的作者或创建日期)的信息。 可以使用对象设置和检索基本信息。
该示例创建一些文档信息元数据。 该信息可以在 PDF 查看器中的 PDF 文档属性中看到。
我们得到对象。
我们设置一些元数据信息。
可扩展元数据平台(XMP)是用于创建,处理和交换数字文档和数据集的标准化和自定义元数据的 ISO 标准。 PDF 文件使用 XMP 来存储其他元数据信息。
这是一个 XML 文档,其中包含有关 PDF 文档的一些基本元数据。
该示例从 XML 文件读取元数据,并将其存储在生成的二进制文档中。
用于处理元数据。
我们将元数据设置为文档的目录。
在下一个示例中,我们从 PDF 文档中读取元数据。
该示例从 PDF 文档读取元数据,并将其打印到控制台。
我们从中检索。
该文档可能不包含元数据; 因此,我们进行一些简单的检查。
为文档的元数据创建输入流。 我们从该流中读取数据并将其打印到终端。
版权声明:
本文来源网络,所有图片文章版权属于原作者,如有侵权,联系删除。
本文网址:https://www.bianchenghao6.com/java-jiao-cheng/10222.html