怎样查看PDF的全部隐藏信息 (作者/创建时间/标题等元数据、属性)
许多 PDF 文件中隐藏了各种您在阅读正文时看不到的信息,如文件作者的真实姓名、使用的编辑工具、文件创建的确切日期等。使用本工具,只需简单几步即可在本地完成这些隐藏信息的查看:
- 导入文件:点击上方红色渐变折角的 PDF 导入区域,或者直接将本地的 PDF 文件拖拽到该区域中。
- 自动解析:文件导入后,页面将展示文件列表。PDF 引擎会在浏览器本地静默解析元数据。解析完成后,每个文件的“PDF Info 字典元数据”与“XMP XML 元数据”面板会自动展示出来。
- 查看与复制:在展示的信息面板中,您可以清晰查看各项属性的键名与键值。如果有需要,可点击每个面板右上角的“复制”按钮一键将全部信息复制到剪贴板。
如果您希望彻底擦除这些隐私信息,可以点击文件卡片右上角的“删除元数据 & 下载”按钮。处理完成后会自动开始下载全新的、无任何隐藏元数据的 PDF 文件。
本程序也能用来检测和判断PDF文件有没有元数据和XMP数据,导入PDF马上就能看到检测结果。
批量查看多个PDF的隐藏信息/元数据属性
本工具完全支持多个文件处理。您可以一次性拖入或选择多个 PDF 文件:
- 导入后,页面上会显示文件的总个数及每个文件的序号,且元数据将异步独立解析,解析进度互不干扰。
- 在多文件场景下,除了可以对单个文件执行清除下载外,列表顶部还会展示“下载全部文件”按钮。
- 点击该按钮后,程序自动批量擦除/删除所有已成功导入文件的 Info 元数据与 XMP 信息,并打包成一个 ZIP 压缩包下载到您的本地。
PDF隐藏数据有哪些种类?
在 PDF 规范中,元数据(Metadata)主要分为两种并存的格式体系:传统的 PDF Info 字典 方式和现代的 XMP(可扩展元数据平台) 流方式。了解这些背景能帮您更好地管理 PDF 隐私。
PDF info 元数据
这是 PDF 规范中最早的、也是最经典的一种元数据存储方式。它通常被以键值对(Key-Value)字典的形式附加在 PDF 的 Trailer 尾部。常见的标准键名(Key)包括:
| 标准属性键 | 属性中文释义 | 代表的技术背景 |
|---|---|---|
Title | 标题 | 文件的主题名称。 |
Author | 作者 | 通常为编辑该文件的 Office、WPS 软件的用户姓名。 |
Subject | 主题 | 关于 PDF 文件内容的简短阐述。 |
Keywords | 关键词 | 用于文档检索和归档的逗号分隔词。 |
Creator | 创建程序 | 将原始文档转换为 PDF 的前置软件名称(如 Microsoft Word)。 |
Producer | PDF 生产程序 | 生成最终 PDF 字节的底层组件(如 Acrobat Distiller 或 Microsoft® Word)。 |
CreationDate | 创建时间 | 文件最初转换为 PDF 的确切时间,通常包含时区。 |
ModDate | 修改时间 | 文件最后一次被 PDF 编辑工具修改或重新保存的时间。 |
Trapped | 补漏白 | 是否进行了印前防露白陷印处理(取值为 True、False 等)。 |
非规范的自定义属性也常会在此字典里出现。比如某些企业系统导出的 PDF 会在这里记录 Company(公司)、SourceID 等自定义键值对。
PDF XMP 元数据
XMP(Extensible Metadata Platform,可扩展元数据平台)是由 Adobe 提倡的现代元数据体系。它不使用简单的字典格式,而是将元数据组织为 XML 格式的数据流 并嵌入到 PDF 文档的 Catalog 节点中。
XMP 基于 W3C 的 RDF 规范,它的优势在于可以支持极其丰富的复杂数据关系(例如多语言描述、摄影相机的快门ISO参数、版权保护的法律声明等)。然而,这也意味着 PDF 内部可能包含了大量更为精细的隐藏隐私。当您想隐藏某些隐私文件,仅删除 Info 字典是不够的,必须同步擦除 XMP 属性流,才能实现完美的物理回收和安全防护。