Як переглянути всю приховану інформацію в PDF (автор, дата створення, назва тощо метадані та властивості)
Багато файлів PDF містять приховану інформацію, яка не відображається під час читання основного тексту, наприклад справжнє ім'я автора, програмне забезпечення, використане для редагування файлу, та точна дата створення. За допомогою цього інструменту ви можете переглядати ці приховані дані локально всього за кілька простих кроків:
- Імпортуйте файли: Клацніть червону область імпорту градієнтної папки вище або перетягніть файли PDF безпосередньо в цю область.
- Автоматичний аналіз: Після імпортування буде показано список файлів. Движок PDF тихо проаналізує метадані локально у вашому браузері. Після завершення панелі «Метадані інформації PDF» та «Метадані XML XMP» для кожного файлу відобразяться автоматично.
- Перегляд та копіювання: На інформаційних панелях, що відображаються, ви можете чітко перевірити ключі та значення різних властивостей. За потреби натисніть кнопку «Копіювати» у верхньому правому куті кожної панелі, щоб скопіювати всю інформацію в буфер обміну одним кліком.
Якщо ви хочете назавжди видалити ці приватні дані, натисніть кнопку «Видалити метадані та завантажити» у верхньому правому куті картки файлу. Після обробки чиста версія файлу PDF (повністю без прихованих метаданих) завантажиться автоматично.
Пакетний перегляд прихованої інформації та метаданих кількох файлів PDF
Цей інструмент повністю підтримує пакетну обробку. Ви можете перетягнути або вибрати кілька файлів PDF одночасно:
- Після імпорту буде показано загальну кількість та індекс кожного файлу. Метадані аналізуються асинхронно та незалежно, не заважаючи один одному.
- У сценаріях із кількома файлами, окрім очищення та завантаження окремих файлів, у верхній частині списку також з’явиться кнопка «Завантажити все».
- Натискання цієї кнопки автоматично видаляє як метадані інформації, так і потоки XMP з усіх успішно імпортованих файлів, пакуючи їх в один ZIP-архів для завантаження.
Які типи прихованих даних існують у PDF?
У специфікації PDF метадані зберігаються переважно у двох співіснуючих системах: традиційному форматі Словника інформації PDF (PDF Info Dictionary) та сучасному форматі потоку XMP (Extensible Metadata Platform). Розуміння цього допомагає вам краще керувати своєю конфіденційністю в PDF.
Метадані інформації PDF
Це найперший і класичний метод зберігання метаданих у специфікації PDF. Він додається до трейлера PDF у вигляді пар ключ-значення (словників). Поширені стандартні ключі включають:
| Стандартний ключ | Опис | Технічний контекст |
|---|---|---|
Title | Назва | Назва теми файлу. |
Author | Автор | Зазвичай ім'я користувача Office або редактора (наприклад, WPS), який створив файл. |
Subject | Тема | Коротке пояснення вмісту файлу PDF. |
Keywords | Ключові слова | Ключові слова, розділені комами, для пошуку та архівування документів. |
Creator | Творець | Назва програмного забезпечення, яке перетворило вихідний документ у PDF (наприклад, Microsoft Word). |
Producer | Виробник PDF | Базовий механізм, який згенерував кінцеві байти PDF (наприклад, Acrobat Distiller або Microsoft® Word). |
CreationDate | Дата створення | Точний час перетворення файлу в PDF, зазвичай із зазначенням часового поясу. |
ModDate | Дата зміни | Часова позначка останньої зміни або збереження файлу PDF. |
Trapped | Прапорець трепінгу | Вказує, чи документ проходив обробку трепінгу (значення True, False тощо). |
У цьому словнику також можуть з’являтися нестандартні користувацькі атрибути. Наприклад, PDF-файли, експортовані з корпоративних систем, часто записують власні пари ключ-значення, такі як Company або SourceID.
Метадані PDF XMP
XMP (Extensible Metadata Platform) — це сучасна система метаданих, рекомендована Adobe. Замість простих словників вона структурує метадані як потік даних XML, вбудований у вузол каталогу (Catalog) PDF.
XMP базується на специфікації W3C RDF, що дозволяє створювати надзвичайно складні структури даних (такі як багатомовні описи, параметри ISO камери та заяви про авторські права). Однак це означає, що PDF-файли можуть містити велику кількість детальних даних про конфіденційність. Для захисту файлів простого очищення словника інформації недостатньо; ви повинні стерти потік XMP, щоб отримати повний фізичний захист конфіденційності.