Как просмотреть всю скрытую информацию в PDF (автор, дата создания, заголовок и т.д. Метаданные и свойства)
Многие файлы PDF содержат скрытую информацию, которая не видна при чтении основного текста, например, настоящее имя автора файла, программное обеспечение, использованное для редактирования файла, и точная дата создания. С помощью этого инструмента вы сможете просмотреть эти скрытые данные локально всего за несколько простых шагов:
- Импорт файлов: Нажмите на область импорта папки с красным градиентом выше или перетащите файлы PDF с компьютера прямо в эту область.
- Автоматический анализ: После импорта отобразится список файлов. Движок PDF бесшумно проанализирует метаданные локально в вашем браузере. По завершении панели «Метаданные PDF Info» и «XML-метаданные XMP» для каждого файла откроются автоматически.
- Просмотр и копирование: В отображаемых информационных панелях вы можете четко проверить ключи и значения различных свойств. При необходимости нажмите кнопку «Копировать» в правом верхнем углу каждой панели, чтобы скопировать всю информацию в буфер обмена в один клик.
Если вы хотите навсегда стереть эту личную информацию, нажмите кнопку «Удалить метаданные и скачать» в правом верхнем углу карточки файла. После обработки чистая версия файла PDF (полностью очищенная от скрытых метаданных) будет скачана автоматически.
Пакетный просмотр скрытой информации и свойств метаданных нескольких файлов PDF
Этот инструмент полностью поддерживает пакетную обработку. Вы можете перетащить или выбрать несколько файлов PDF одновременно:
- После импорта отобразится общее количество файлов и порядковый номер каждого файла. Метаданные анализируются асинхронно и независимо друг от друга, не мешая процессу.
- В сценарии с несколькими файлами в дополнение к очистке и скачиванию отдельных файлов в верхней части списка появится кнопка «Скачать все».
- При нажатии на эту кнопку автоматически удаляются метаданные Info и потоки XMP изо всех успешно импортированных файлов, и они упаковываются в один ZIP-архив для скачивания.
Какие виды скрытых данных существуют в PDF?
В спецификации PDF метаданные в основном хранятся в двух сосуществующих системах: традиционном формате словаря PDF Info и современном формате потока XMP (Extensible Metadata Platform). Понимание этого поможет вам лучше управлять конфиденциальностью ваших файлов PDF.
Метаданные PDF Info
Это самый ранний и классический способ хранения метаданных в спецификации PDF. Он добавляется в конце PDF-файла в виде словаря пар «ключ-значение». Стандартные ключи включают в себя:
| Стандартный ключ | Описание | Технический контекст |
|---|---|---|
Title | Заголовок | Название темы файла. |
Author | Автор | Обычно имя пользователя офисного пакета или редактора (например, WPS), создавшего файл. |
Subject | Тема | Краткое описание содержания PDF-файла. |
Keywords | Ключевые слова | Разделенные запятыми ключевые слова для поиска и архивирования документов. |
Creator | Создатель | Название программы, которая преобразовала исходный документ в PDF (например, Microsoft Word). |
Producer | Производитель PDF | Базовый движок, создавший итоговые байты PDF (например, Acrobat Distiller или Microsoft® Word). |
CreationDate | Дата создания | Точное время, когда файл был преобразован в PDF, обычно с указанием часового пояса. |
ModDate | Дата изменения | Временная метка последнего изменения или пересохранения файла PDF. |
Trapped | Флаг треппинга | Указывает, был ли документ подвергнут допечатной подготовке треппинга (значение True, False и т. д.). |
В этом словаре также могут появляться нестандартные пользовательские атрибуты. Например, файлы PDF, экспортированные из корпоративных систем, часто содержат пользовательские пары «ключ-значение», такие как Company или SourceID.
Метаданные PDF XMP
XMP (Extensible Metadata Platform) — это современная система метаданных, продвигаемая Adobe. Вместо простых словарей она структурирует метаданные в виде XML-потока данных, встроенного в узел Catalog PDF-файла.
XMP основан на спецификации W3C RDF, которая позволяет создавать очень сложные структуры данных (такие как многоязычные описания, параметры ISO камеры и заявления об авторских правах). Однако это также означает, что файлы PDF могут содержать большое количество подробных конфиденциальных данных. Для защиты файлов простого удаления словаря Info недостаточно; вам необходимо очистить поток XMP для достижения полной защиты личных данных.