Xem thông tin ẩn (metadata) trong PDF - Trình xem Metadata PDF trực tuyến - Xem và xóa Metadata PDF (XMP) - Windows Mac Xem dữ liệu ẩn PDF, Xóa Metadata PDF, Xóa thông tin riêng tư PDF, Xóa hàng loạt Metadata PDF - Hộp công cụ it365 PDF

Cách xem tất cả thông tin ẩn trong PDF (Tác giả, Ngày tạo, Tiêu đề, v.v. Metadata & Thuộc tính)

Nhiều tệp PDF chứa thông tin ẩn không thể nhìn thấy khi đọc văn bản chính, chẳng hạn như tên thật của tác giả, phần mềm được sử dụng để chỉnh sửa tệp và ngày tạo chính xác. Với công cụ này, bạn có thể xem dữ liệu ẩn này cục bộ chỉ bằng vài bước đơn giản:

Nhập tệp: Nhấp vào khu vực nhập thư mục gradient màu đỏ ở trên hoặc kéo và thả tệp PDF cục bộ của bạn trực tiếp vào khu vực đó.
Phân tích tự động: Sau khi nhập, danh sách tệp sẽ được hiển thị. Công cụ PDF sẽ âm thầm phân tích siêu dữ liệu cục bộ trong trình duyệt của bạn. Khi hoàn tất, các bảng "Metadata thông tin PDF" và "Metadata XML XMP" cho từng tệp sẽ tự động hiển thị.
Xem & Sao chép: Trong các bảng thông tin hiển thị, bạn có thể kiểm tra rõ ràng các khóa và giá trị của các thuộc tính khác nhau. Nếu cần, hãy nhấp vào nút "Sao chép" ở góc trên bên phải của mỗi bảng để sao chép tất cả thông tin vào khay nhớ tạm của bạn bằng một lần nhấp.

Xóa thông tin ẩn / Metadata

Nếu bạn muốn xóa vĩnh viễn dữ liệu riêng tư này, hãy nhấp vào nút "Xóa Metadata & Tải xuống" ở góc trên bên phải của thẻ tệp. Sau khi xử lý, một phiên bản sạch của tệp PDF (hoàn toàn không có metadata ẩn) sẽ tự động tải xuống.

Xem hàng loạt thuộc tính thông tin ẩn & siêu dữ liệu của nhiều tệp PDF

Công cụ này hỗ trợ đầy đủ xử lý hàng loạt. Bạn có thể kéo và thả hoặc chọn nhiều tệp PDF cùng một lúc:

Sau khi nhập, tổng số lượng và chỉ số của từng tệp sẽ được hiển thị. Metadata được phân tích không đồng bộ và độc lập mà không can thiệp lẫn nhau.
Trong trường hợp nhiều tệp, ngoài việc làm sạch và tải xuống từng tệp riêng lẻ, nút "Tải xuống tất cả" cũng sẽ xuất hiện ở đầu danh sách.
Nhấp vào nút này sẽ tự động xóa cả metadata Info và luồng XMP khỏi tất cả các tệp đã nhập thành công, đóng gói chúng thành một kho lưu trữ ZIP duy nhất để tải xuống.

Có những loại dữ liệu ẩn nào tồn tại trong tệp PDF?

Trong đặc tả PDF, siêu dữ liệu chủ yếu được lưu trữ trong hai hệ thống đồng tồn tại: định dạng PDF Info Dictionary truyền thống và định dạng luồng XMP (Extensible Metadata Platform) hiện đại. Hiểu được điều này giúp bạn quản lý quyền riêng tư PDF của mình tốt hơn.

Metadata thông tin PDF

Đây là phương pháp lưu trữ metadata sớm nhất và cổ điển nhất trong đặc tả PDF. Nó được gắn vào PDF Trailer dưới dạng các cặp khóa-giá trị (từ điển). Các khóa tiêu chuẩn phổ biến bao gồm:

Khóa tiêu chuẩn	Mô tả	Bối cảnh kỹ thuật
`Title`	Tiêu đề	Tên chủ đề của tệp.
`Author`	Tác giả	Thường là tên người dùng của Office hoặc phần mềm soạn thảo (ví dụ: WPS) đã tạo ra tệp.
`Subject`	Chủ đề	Giải thích ngắn gọn về nội dung của tệp PDF.
`Keywords`	Từ khóa	Các từ khóa được phân tách bằng dấu phẩy để tìm kiếm và lưu trữ tài liệu.
`Creator`	Người tạo	Tên của phần mềm đã chuyển đổi tài liệu gốc sang PDF (ví dụ: Microsoft Word).
`Producer`	Nhà sản xuất PDF	Công cụ cơ bản đã tạo ra các byte PDF cuối cùng (ví dụ: Acrobat Distiller hoặc Microsoft® Word).
`CreationDate`	Ngày tạo	Thời gian chính xác khi tệp được chuyển đổi sang PDF, thường chứa độ lệch múi giờ.
`ModDate`	Ngày sửa đổi	Dấu thời gian của lần sửa đổi hoặc lưu cuối cùng của tệp PDF.
`Trapped`	Cờ bẫy	Cho biết tài liệu đã được xử lý bẫy màu hay chưa (giá trị là True, False, v.v.).

Các thuộc tính tùy chỉnh không chuẩn cũng có thể xuất hiện trong từ điển này. Ví dụ: các tệp PDF được xuất từ hệ thống doanh nghiệp thường ghi lại các cặp khóa-giá trị tùy chỉnh như Company hoặc SourceID.

PDF XMP Metadata

XMP (Extensible Metadata Platform) là một hệ thống siêu dữ liệu hiện đại do Adobe khởi xướng. Thay vì các từ điển đơn giản, nó cấu trúc siêu dữ liệu dưới dạng một luồng dữ liệu XML được nhúng trong nút Catalog của PDF.

XMP dựa trên đặc tả W3C RDF, cho phép các cấu trúc dữ liệu cực kỳ phức tạp (như mô tả đa ngôn ngữ, thông số ISO của máy ảnh và tuyên bố bản quyền). Tuy nhiên, điều này có nghĩa là các tệp PDF có thể chứa một lượng lớn dữ liệu riêng tư chi tiết. Khi bảo mật tệp, việc xóa từ điển Info đơn giản là không đủ; bạn phải xóa luồng XMP để đạt được sự bảo vệ quyền riêng tư vật lý hoàn toàn.