Как да прегледате цялата скрита информация в PDF (автор, дата на създаване, заглавие и др. метаданни & свойства)
Много PDF файлове съдържат скрита информация, която не се вижда при четене на основния текст, като например истинското име на автора, софтуера, използван за редактиране на файла, и точната дата на създаване. С този инструмент можете да прегледате тези скрити данни локално в няколко лесни стъпки:
- Импортиране на файлове: Кликнете върху червената градиентна зона за импортиране на папки по-горе или плъзнете и пуснете вашите локални PDF файлове директно в тази зона.
- Автоматичен анализ: След импортирането ще се покаже списък с файлове. PDF системата тихо ще анализира метаданните локално във вашия браузър. При приключване автоматично ще се покажат разделите „Метаданни за информация на PDF“ и „XMP XML метаданни“ за всеки файл.
- Преглед и копиране: В показаните информационни раздели можете ясно да проверите ключовете и стойностите на различните свойства. При необходимост щракнете върху бутона „Копирай“ в горния десен ъгъл на всеки раздел, за да копирате цялата информация в клипборда си с едно кликване.
Ако искате да изтриете трайно тези поверителни данни, кликнете върху бутона „Премахване на метаданни & Изтегляне“ в горния десен ъгъл на картата на файла. След обработката автоматично ще се изтегли чиста версия на PDF файла (напълно лишена от скрити метаданни).
Групов преглед на скрита информация и свойства на метаданни на множество PDF файлове
Този инструмент напълно поддържа групова обработка. Можете да плъзнете и пуснете или да изберете няколко PDF файла едновременно:
- След импортирането ще се покаже общият брой и индексът на всеки файл. Метаданните се анализират асинхронно и независимо, без да си пречат едно на друго.
- При сценарии с множество файлове, освен почистването и изтеглянето на отделни файлове, в горната част на списъка ще се появи и бутон „Изтегли всички“.
- Кликването върху този бутон автоматично премахва както Info метаданните, така и XMP потоците от всички успешно импортирани файлове, опаковайки ги в един ZIP архив за изтегляне.
Какви видове скрити данни съществуват в PDF файловете?
В PDF спецификацията метаданните се съхраняват главно в две съпътстващи системи: традиционния формат PDF Info Dictionary и модерния поток формат XMP (Extensible Metadata Platform). Разбирането на това ви помага да управлявате по-добре поверителността на вашите PDF файлове.
Метаданни за информация на PDF
Това е най-ранният и най-класически метод за съхранение на метаданни в PDF спецификацията. Той се прикрепя към PDF Trailer под формата на двойки ключ-стойност (речници). Общите стандартни ключове включват:
| Стандартен ключ | Описание | Технически контекст |
|---|---|---|
Title | Заглавие | Името на темата на файла. |
Author | Автор | Обикновено потребителското име на Office или софтуера за редактиране (напр. WPS), създал файла. |
Subject | Тема | Кратко обяснение на съдържанието на PDF файла. |
Keywords | Ключови думи | Ключови думи, разделени със запетая, за търсене и архивиране на документи. |
Creator | Създател | Името на софтуера, който е конвертирал оригиналния документ в PDF (напр. Microsoft Word). |
Producer | PDF производител | Основната система, генерирала крайните PDF байтове (напр. Acrobat Distiller или Microsoft® Word). |
CreationDate | Дата на създаване | Точното време на конвертиране на файла в PDF, обикновено съдържащо отместване на часовата зона. |
ModDate | Дата на промяна | Времевото клеймо на последната промяна или записване на PDF файла. |
Trapped | Флаг за trapping | Указва дали документът е преминал през trapping обработка (стойността е True, False и др.). |
В този речник могат да се появяват и нестандартни потребителски атрибути. Например, PDF файловете, експортирани от корпоративни системи, често записват потребителски двойки ключ-стойност като Company или SourceID.
PDF XMP метаданни
XMP (Extensible Metadata Platform) е съвременна система за метаданни, поддържана от Adobe. Вместо прости речници, тя структурира метаданните като XML поток от данни, вграден в Catalog възела на PDF файла.
XMP се основава на спецификацията W3C RDF, което позволява изключително сложни структури от данни (като многоезични описания, ISO параметри на камерата и декларации за авторски права). Това обаче означава, че PDF файловете могат да съдържат огромно количество подробни данни за поверителност. При защита на файлове, простото изчистване на речника Info е недостатъчно; трябва да изтриете XMP потока, за да постигнете пълна физическа защита на поверителността.