Jak wyświetlić wszystkie ukryte informacje w pliku PDF (autor, data utworzenia, tytuł itp. metadane i właściwości)
Wiele plików PDF zawiera ukryte informacje, które nie są widoczne podczas czytania głównego tekstu, takie jak prawdziwe imię i nazwisko autora, oprogramowanie użyte do edycji pliku oraz dokładna data utworzenia. Dzięki temu narzędziu możesz przeglądać te ukryte dane lokalnie w kilku prostych krokach:
- Importuj pliki: Kliknij czerwony obszar importu folderu gradientowego powyżej lub przeciągnij i upuść pliki PDF bezpośrednio w tym obszarze.
- Automatyczna analiza: Po zaimportowaniu zostanie wyświetlona lista plików. Silnik PDF po cichu przeanalizuje metadane lokalnie w Twojej przeglądarce. Po zakończeniu panele „Metadane informacyjne PDF” i „Metadane XML XMP” dla każdego pliku zostaną wyświetlone automatycznie.
- Wyświetl i kopiuj: W wyświetlonych panelach informacyjnych możesz wyraźnie sprawdzić klucze i wartości różnych właściwości. W razie potrzeby kliknij przycisk „Kopiuj” w prawym górnym rogu każdego panelu, aby jednym kliknięciem skopiować wszystkie informacje do schowka.
Jeśli chcesz trwale usunąć te prywatne dane, kliknij przycisk „Usuń metadane i pobierz” w prawym górnym rogu karty pliku. Po przetworzeniu czysta wersja pliku PDF (całkowicie wolna od ukrytych metadanych) zostanie pobrana automatycznie.
Zbiorcze wyświetlanie ukrytych informacji i metadanych wielu plików PDF
To narzędzie w pełni obsługuje przetwarzanie wsadowe. Możesz przeciągnąć i upuścić lub wybrać wiele plików PDF jednocześnie:
- Po zaimportowaniu zostanie wyświetlona całkowita liczba i indeks każdego pliku. Metadane są analizowane asynchronicznie i niezależnie, nie zakłócając się wzajemnie.
- W scenariuszach z wieloma plikami, oprócz czyszczenia i pobierania pojedynczych plików, na górze listy pojawi się również przycisk „Pobierz wszystkie”.
- Kliknięcie tego przycisku automatycznie usuwa zarówno metadane informacyjne, jak i strumienie XMP ze wszystkich pomyślnie zaimportowanych plików, pakując je w jedno archiwum ZIP do pobrania.
Jakie rodzaje ukrytych danych istnieją w plikach PDF?
W specyfikacji PDF metadane są przechowywane głównie w dwóch współistniejących systemach: tradycyjnym formacie Słownika informacji PDF (PDF Info Dictionary) oraz nowoczesnym formacie strumienia XMP (Extensible Metadata Platform). Zrozumienie tego pomaga lepiej zarządzać prywatnością plików PDF.
Metadane informacyjne PDF
Jest to najwcześniejsza i najbardziej klasyczna metoda przechowywania metadanych w specyfikacji PDF. Jest on dołączany do zwiastuna PDF (PDF Trailer) w postaci par klucz-wartość (słowników). Wspólne standardowe klucze obejmują:
| Standardowy klucz | Opis | Kontekst techniczny |
|---|---|---|
Title | Tytuł | Nazwa tematu pliku. |
Author | Autor | Zazwyczaj nazwa użytkownika pakietu Office lub oprogramowania edytora (np. WPS), które utworzyło plik. |
Subject | Temat | Krótkie wyjaśnienie zawartości pliku PDF. |
Keywords | Słowa kluczowe | Słowa kluczowe rozdzielone przecinkami do wyszukiwania i archiwizacji dokumentów. |
Creator | Twórca | Nazwa oprogramowania, które przekonwertowało oryginalny dokument na format PDF (np. Microsoft Word). |
Producer | Producent PDF | Silnik bazowy, który wygenerował ostateczne bajty PDF (np. Acrobat Distiller lub Microsoft® Word). |
CreationDate | Data utworzenia | Dokładny czas konwersji pliku na format PDF, zwykle zawierający przesunięcie strefy czasowej. |
ModDate | Data modyfikacji | Sygnatura czasowa ostatniej modyfikacji lub zapisu pliku PDF. |
Trapped | Flaga zalewkowania | Wskazuje, czy dokument został przetworzony pod kątem zalewkowania (wartość True, False itp.). |
W tym słowniku mogą pojawiać się również niestandardowe atrybuty użytkownika. Na przykład pliki PDF eksportowane z systemów korporacyjnych często rejestrują niestandardowe pary klucz-wartość, takie jak Company lub SourceID.
Metadane PDF XMP
XMP (Extensible Metadata Platform) to nowoczesny system metadanych zalecany przez firmę Adobe. Zamiast prostych słowników, strukturyzuje metadane jako strumień danych XML osadzony w węźle katalogu (Catalog) pliku PDF.
XMP opiera się na specyfikacji W3C RDF, co umożliwia tworzenie wysoce złożonych struktur danych (takich jak opisy wielojęzyczne, parametry ISO aparatu i oświadczenia o prawach autorskich). Oznacza to jednak, że pliki PDF mogą zawierać ogromną ilość szczegółowych danych dotyczących prywatności. W celu zabezpieczenia plików zwykłe czyszczenie słownika informacyjnego nie wystarczy; musisz wymazać strumień XMP, aby uzyskać pełną fizyczную ochronę prywatności.