PDFのすべての隠し情報(作成者、作成日時、タイトルなどのメタデータとプロパティ)を表示する方法
多くのPDFファイルには、作成者の本名、ファイルの編集に使用されたソフトウェア、正確な作成日時など、本文を読むだけでは見えないさまざまな情報が隠されています。このツールを使用すると、簡単な手順でこれらの隠し情報をローカルで表示できます:
- ファイルのインポート:上の赤いグラデーションフォルダーのインポートエリアをクリックするか、ローカルのPDFファイルをそのエリアに直接ドラッグ&ドロップします。
- 自動解析:インポートされると、ファイルリストが表示されます。PDFエンジンはブラウザのローカル環境でメタデータを静かに解析します。完了すると、各ファイルの「PDF Infoメタデータ」と「XMP XMLメタデータ」パネルが自動的に表示されます。
- 表示とコピー:表示された情報パネルで、さまざまなプロパティのキーと値を明確に確認できます。必要に応じて、各パネルの右上にある「コピー」ボタンをクリックし、すべての情報をワンクリックでクリップボードにコピーできます。
これらの個人情報を完全に消去したい場合は、ファイルカードの右上にある「メタデータを削除してダウンロード」ボタンをクリックします。処理が完了すると、隠しメタデータが完全に含まれていないクリーンなPDFファイルが自動的にダウンロードされます。
複数のPDFの隠し情報とメタデータプロパティの一括表示
このツールは一括処理に完全に対応しています。複数のPDFファイルを一度にドラッグ&ドロップまたは選択できます:
- インポートされると、ファイルの総数と各ファイルのインデックスが表示されます。メタデータは、互いに干渉することなく非同期かつ個別に解析されます。
- 複数ファイルの場合、個々のファイルのクリーンアップとダウンロードに加えて、リストの上部に「すべてダウンロード」ボタンも表示されます。
- このボタンをクリックすると、正常にインポートされたすべてのファイルからInfoメタデータとXMPストリームの両方が自動的に削除され、ダウンロード用に1つのZIPアーカイブにパッケージ化されます。
PDFにはどのような隠しデータが存在しますか?
PDFの仕様では、メタデータは主に、従来のPDF Infoディクショナリ形式と、現代のXMP(Extensible Metadata Platform)ストリーム形式という2つの共存システムに格納されています。これを理解することで、PDFのプライバシーをより適切に管理できます。
PDF Infoメタデータ
これはPDF仕様の中で最も古く、最も古典的なメタデータ格納方法です。キーと値(ディクショナリ)のペアとしてPDFのトレイラーの最後に追加されます。一般的な標準キーは次のとおりです:
| 標準キー | 説明 | 技術的背景 |
|---|---|---|
Title | タイトル | ファイルの件名。 |
Author | 作成者 | 通常、ファイルを作成したOfficeまたはエディタソフトウェア(WPSなど)のユーザー名。 |
Subject | サブジェクト | PDFファイルの内容に関する簡単な説明。 |
Keywords | キーワード | ドキュメントの検索 and アーカイブ用のカンマ区切りキーワード。 |
Creator | アプリケーション名 | 元のドキュメントをPDFに変換したソフトウェアの名前(Microsoft Wordなど)。 |
Producer | PDF作成元 | 最終的なPDFバイトを生成した基盤となるエンジン(Acrobat DistillerやMicrosoft® Wordなど)。 |
CreationDate | 作成日時 | ファイルがPDFに変換された正確な日時。通常、タイムゾーンオフセットが含まれます。 |
ModDate | 更新日時 | PDFファイルが最後に変更または再保存されたタイムスタンプ。 |
Trapped | トラップフラグ | ドキュメントがトラッピング処理されたかどうかを示します(値はTrue、Falseなど)。 |
このディクショナリには、非標準のカスタム属性も表示される場合があります。たとえば、企業システムからエクスポートされたPDFでは、CompanyやSourceIDなどのカスタムキーと値のペアが記録されることがよくあります。
PDF XMPメタデータ
XMP(Extensible Metadata Platform)は、Adobeが提唱する現代的なメタデータシステムです。単純なディクショナリではなく、メタデータをXMLデータストリームとして構築し、PDFのCatalogノード内に埋め込みます。
XMPはW3CのRDF仕様に基づいており、非常に複雑なデータ構造(多言語の記述、カメラのISOパラメータ、著作権保護の法的宣言など)を可能にします。しかし、これはPDF内に大量の詳細な個人情報が含まれている可能性があることを意味します。ファイルを保護する場合、Infoディクショナリを消去するだけでは不十分です。完全な物理的プライバシー保護を達成するには、XMPストリームも消去する必要があります。