วิธีดูข้อมูลที่ซ่อนอยู่ทั้งหมดใน PDF (ผู้เขียน, วันที่สร้าง, ชื่อเรื่อง ฯลฯ เมทาดาตา & คุณสมบัติ)
ไฟล์ PDF จำนวนมากมีข้อมูลที่ซ่อนอยู่ซึ่งมองไม่เห็นเมื่ออ่านข้อความหลัก เช่น ชื่อจริงของผู้เขียน ซอฟต์แวร์ที่ใช้ในการแก้ไขไฟล์ และวันที่สร้างที่แน่นอน ด้วยเครื่องมือนี้ คุณสามารถดูข้อมูลที่ซ่อนอยู่นี้ภายในเครื่องได้ในไม่กี่ขั้นตอนง่ายๆ:
- นำเข้าไฟล์: คลิกพื้นที่นำเข้าโฟลเดอร์ไล่ระดับสีแดงด้านบน หรือลากและวางไฟล์ PDF ของคุณไปยังพื้นที่นั้นโดยตรง
- วิเคราะห์อัตโนมัติ: เมื่อนำเข้าแล้ว รายการไฟล์จะแสดงขึ้น เครื่องมือ PDF จะวิเคราะห์เมทาดาตาอย่างเงียบๆ ภายในเครื่องในเบราว์เซอร์ของคุณ เมื่อเสร็จสิ้น แผง "เมทาดาตาข้อมูล PDF" และ "เมทาดาตา XML XMP" ของแต่ละไฟล์จะแสดงขึ้นโดยอัตโนมัติ
- ดู & คัดลอก: ในแผงข้อมูลที่แสดง คุณสามารถตรวจสอบคีย์และค่าของคุณสมบัติต่างๆ ได้อย่างชัดเจน หากจำเป็น ให้คลิกปุ่ม "คัดลอก" ที่มุมขวาบนของแต่ละแผงเพื่อคัดลอกข้อมูลทั้งหมดไปยังคลิปบอร์ดของคุณด้วยการคลิกเพียงครั้งเดียว
หากคุณต้องการลบข้อมูลส่วนตัวนี้อย่างถาวร ให้คลิกปุ่ม "ลบเมทาดาตา & ดาวน์โหลด" ที่มุมขวาบนของบัตรไฟล์ เมื่อประมวลผลแล้ว ไฟล์ PDF เวอร์ชันที่สะอาด (ปราศจากเมทาดาตาที่ซ่อนอยู่โดยสิ้นเชิง) จะถูกดาวน์โหลดโดยอัตโนมัติ
ดูคุณสมบัติข้อมูลที่ซ่อนอยู่ & เมทาดาตาของ PDF หลายไฟล์พร้อมกันแบบกลุ่ม
เครื่องมือนี้รองรับการประมวลผลแบบกลุ่มอย่างเต็มที่ คุณสามารถลากและวางหรือเลือกไฟล์ PDF หลายไฟล์พร้อมกันได้:
- เมื่อนำเข้าแล้ว จำนวนทั้งหมดและดัชนีของแต่ละไฟล์จะแสดงขึ้น เมทาดาตาจะถูกวิเคราะห์แบบอะซิงโครนัสและเป็นอิสระต่อกันโดยไม่รบกวนซึ่งกันและกัน
- ในกรณีที่มีหลายไฟล์ นอกจากการล้างและดาวน์โหลดทีละไฟล์แล้ว ปุ่ม "ดาวน์โหลดทั้งหมด" จะปรากฏที่ด้านบนของรายการด้วย
- การคลิกปุ่มนี้จะลบทั้งเมทาดาตา Info และสตรีม XMP ออกจากไฟล์ทั้งหมดที่นำเข้าสำเร็จโดยอัตโนมัติ และรวมเข้าเป็นไฟล์บีบอัด ZIP ไฟล์เดียวเพื่อดาวน์โหลด
ข้อมูลที่ซ่อนอยู่ประเภทใดบ้างที่มีอยู่ใน PDF?
ในข้อกำหนดของ PDF เมทาดาตาจะถูกจัดเก็บไว้ในสองระบบที่ทำงานร่วมกันเป็นหลัก: รูปแบบ PDF Info Dictionary ดั้งเดิม และรูปแบบสตรีม XMP (Extensible Metadata Platform) สมัยใหม่ การเข้าใจสิ่งนี้จะช่วยให้คุณจัดการความเป็นส่วนตัวของ PDF ได้ดีขึ้น
เมทาดาตาข้อมูล PDF
นี่คือวิธีการจัดเก็บเมทาดาตาที่เก่าแก่ที่สุดและคลาสสิกที่สุดในข้อกำหนด PDF โดยจะแนบไปกับ PDF Trailer ในรูปแบบของคู่คีย์-ค่า (พจนานุกรม) คีย์มาตรฐานทั่วไป ได้แก่:
| คีย์มาตรฐาน | คำอธิบาย | บริบททางเทคนิค |
|---|---|---|
Title | ชื่อเรื่อง | ชื่อหัวเรื่องของไฟล์ |
Author | ผู้เขียน | โดยทั่วไปจะเป็นชื่อผู้ใช้ของซอฟต์แวร์ Office หรือโปรแกรมแก้ไข (เช่น WPS) ที่สร้างไฟล์ |
Subject | หัวข้อ | คำอธิบายสั้นๆ เกี่ยวกับเนื้อหาของไฟล์ PDF |
Keywords | คำสำคัญ | คำสำคัญที่คั่นด้วยเครื่องหมายจุลภาคสำหรับการค้นหาเอกสารและการจัดเก็บถาวร |
Creator | ผู้สร้าง | ชื่อของซอฟต์แวร์ที่แปลงเอกสารต้นฉบับเป็น PDF (เช่น Microsoft Word) |
Producer | ผู้ผลิต PDF | เครื่องมือพื้นฐานที่สร้างไบต์ PDF ขั้นสุดท้าย (เช่น Acrobat Distiller หรือ Microsoft® Word) |
CreationDate | วันที่สร้าง | เวลาที่แน่นอนเมื่อแปลงไฟล์เป็น PDF โดยปกติจะมีผลต่างเขตเวลาอยู่ด้วย |
ModDate | วันที่แก้ไข | การประทับเวลาของการแก้ไขหรือการบันทึกไฟล์ PDF ครั้งล่าสุด |
Trapped | แฟลกการจัดจับสี | ระบุว่าเอกสารผ่านกระบวนการจัดจับสีหรือไม่ (ค่าคือ True, False เป็นต้น) |
คุณลักษณะแบบกำหนดเองที่ไม่ได้มาตรฐานอาจปรากฏในพจนานุกรมนี้ด้วย ตัวอย่างเช่น PDF ที่ส่งออกจากระบบขององค์กร มักจะบันทึกคู่คีย์-ค่าแบบกำหนดเอง เช่น Company หรือ SourceID
PDF XMP เมทาดาตา
XMP (Extensible Metadata Platform) เป็นระบบเมทาดาตาสมัยใหม่ที่สนับสนุนโดย Adobe แทนที่จะเป็นพจนานุกรมธรรมดา ระบบจะจัดโครงสร้างเมทาดาตาเป็น สตรีมข้อมูล XML ที่ฝังอยู่ในโหนด Catalog ของ PDF
XMP อิงตามข้อกำหนด W3C RDF ช่วยให้โครงสร้างข้อมูลมีความซับซ้อนสูง (เช่น คำอธิบายหลายภาษา, พารามิเตอร์ ISO ของกล้อง และข้อความลิขสิทธิ์) อย่างไรก็ตาม นี่หมายความว่า PDF อาจมีข้อมูลความเป็นส่วนตัวที่มีรายละเอียดสูงจำนวนมาก ในการรักษาความปลอดภัยไฟล์ การล้างพจนานุกรม Info เพียงอย่างเดียวนั้นไม่เพียงพอ คุณต้องลบสตรีม XMP ออกเพื่อให้ได้รับการปกป้องความเป็นส่วนตัวทางกายภาพอย่างสมบูรณ์