כיצד להציג את כל המידע הסמוי ב-PDF (מחבר, תאריך יצירה, כותרת וכו' מטא-נתונים ומאפיינים)
קבצי PDF רבים מכילים מידע סמוי שאינו גלוי בעת קריאת הטקסט הראשי, כגון שמו האמיתי של המחבר, התוכנה שבה השתמשו לעריכת הקובץ ותאריך היצירה המדויק. באמצעות כלי זה, תוכל להציג נתונים סמויים אלה באופן מקומי בכמה שלבים פשוטים:
- ייבוא קבצים: לחץ על אזור ייבוא התיקיות בעל מעבר הצבעים האדום למעלה, או גרור ושחרר את קבצי ה-PDF המקומיים שלך ישירות לאזור זה.
- ניתוח אוטומטי: לאחר הייבוא, תוצג רשימת קבצים. מנוע ה-PDF ינתח בשקט את המטא-נתונים באופן מקומי בדפדפן שלך. עם הסיום, חלונות ה-"מטא-נתונים של מידע PDF" ו-"מטא-נתונים XML XMP" עבור כל קובץ יוצגו באופן אוטומטי.
- הצגה והעתקה: בחלונות המידע המוצגים, תוכל לבדוק בבירור את המפתחות והערכים של מאפיינים שונים. במידת הצורך, לחץ על כפתור "העתק" בפינה הימנית העליונה של כל חלון כדי להעתיק את כל המידע ללוח הגזירים שלך בלחיצה אחת.
אם ברצונך למחוק לצמיתות את הנתונים הפרטיים הללו, לחץ על כפתור "הסר מטא-נתונים והורד" בפינה הימנית העליונה של כרטיס הקובץ. לאחר העיבוד, גרסה נקייה של קובץ ה-PDF (נקייה לחלוטין ממטא-נתונים סמויים) תרד באופן אוטומטי.
הצגה מרוכזת של מידע סמוי ומאפייני מטא-נתונים של קבצי PDF מרובים בקבוצה
כלי זה תומך באופן מלא בעיבוד קבוצתי. ניתן לגרור ולשחרר או לבחור קבצי PDF מרובים בבת אחת:
- לאחר הייבוא, יוצגו המספר הכולל והאינדקס של כל קובץ. המטא-נתונים מנותחים באופן אסינכרוני ועצמאי מבלי להפריע זה לזה.
- במצבים של מספר קבצים, בנוסף לניקוי והורדה של קבצים בודדים, יופיע גם כפתור "הורד הכל" בראש הרשימה.
- לחיצה על כפתור זה מסירה באופן אוטומטי הן את מטא-נתוני המידע והן את זרמי ה-XMP מכל הקבצים שיובאו בהצלחה, ואורזת אותם לארכיון ZIP יחיד להורדה.
אילו סוגי נתונים סמויים קיימים ב-PDF?
במפרט ה-PDF, מטא-נתונים מאוחסנים בעיקר בשתי מערכות המתקיימות במקביל: פורמט מילון המידע של PDF (PDF Info Dictionary) המסורתי ופורמט זרם XMP (Extensible Metadata Platform) המודרני. הבנת זה תעזור לך לנהל טוב יותר את פרטיות ה-PDF שלך.
מטא-נתונים של מידע PDF
זוהי שיטת אחסון המטא-נתונים המוקדמת והקלאסית ביותר במפרט ה-PDF. היא מתווספת ל-PDF Trailer בצורה של זוגות מפתח-ערך (מילונים). מפתחות סטנדרטיים נפוצים כוללים:
| מפתח סטנדרטי | תיאור | הקשר טכני |
|---|---|---|
Title | כותרת | שם הנושא של הקובץ. |
Author | מחבר | בדרך כלל שם המשתמש של תוכנת האופיס או העריכה (למשל WPS) שיצרה את הקובץ. |
Subject | נושא | הסבר קצר על תוכן קובץ ה-PDF. |
Keywords | מילות מפתח | מילות מפתח מופרדות בפסיקים לחיפוש וארכוב מסמכים. |
Creator | יוצר | שם התוכנה שהמירה את המסמך המקורי ל-PDF (למשל Microsoft Word). |
Producer | יצרן PDF | המנוע הבסיסי שייצר את בייטי ה-PDF הסופיים (למשל Acrobat Distiller או Microsoft® Word). |
CreationDate | תאריך יצירה | הזמן המדויק שבו הקובץ הומר ל-PDF, בדרך כלל מכיל היסט של אזור זמן. |
ModDate | תאריך שינוי | חותמת הזמן של השינוי או השמירה האחרונים של קובץ ה-PDF. |
Trapped | דגל לכוד | מציין אם המסמך עבר עיבוד לכידה (הערך הוא True, False וכו'). |
מאפיינים מותאמים אישית שאינם סטנדרטיים עשויים להופיע גם במילון זה. לדוגמה, קבצי PDF המיוצאים ממערכות ארגוניות מתעדים לעיתים קרובות זוגות מפתח-ערך מותאמים אישית כגון Company או SourceID.
מטא-נתונים של PDF XMP
XMP (Extensible Metadata Platform) היא מערכת מטא-נתונים מודרנית המומלצת על ידי אדובי. במקום מילונים פשוטים, היא מבנה מטא-נתונים כזרם נתוני XML המוטמע בתוך צומת הקטלוג (Catalog) של ה-PDF.
XMP מבוסס על מפרט W3C RDF, המאפשר מבני נתונים מורכבים ביותר (כגון תיאורים רב-לשוניים, פרמטרי ISO של מצלמה והצהרות זכויות יוצרים). עם זאת, משמעות הדבר היא שקבצי PDF עשויים להכיל כמות עצומה של נתוני פרטיות מפורטים. בעת אבטחת קבצים, ניקוי פשוט של מילון המידע אינו מספיק; עליך למחוק גם את זרם ה-XMP כדי להשיג הגנת פרטיות פיזית מלאה.