Biến một file PDF scan nhiều văn bản thành hàng trăm tài liệu riêng lẻ — tự động, đúng quy chuẩn đặt tên, kèm bảng kê đầy đủ.
Khi hồ sơ lưu trữ được scan thành một file PDF dài — hàng chục, hàng trăm văn bản nối liền — việc tách từng tài liệu, đặt tên file và lập bảng kê vẫn thường làm bằng tay. Tốn thời gian, dễ sót, khó đồng nhất quy tắc đặt tên.
PDFEX là phần mềm chuyên dụng giúp bóc tách và số hóa hồ sơ lưu trữ từ PDF scan. Chỉ cần kéo thả file, phần mềm tự OCR, nhận diện ranh giới từng văn bản (theo quốc hiệu, số hiệu, loại văn bản), tách thành file PDF riêng và xuất bảng kê chi tiết — sẵn sàng nộp lưu trữ hoặc import vào hệ thống quản lý.
PDFEX hiểu cấu trúc văn bản UBND và các cơ quan nhà nước: Quyết định, Công văn, Tờ trình, Nghị quyết, Báo cáo, Biên bản, Chỉ thị… và nhiều loại khác. Chế độ Tự nhận diện phù hợp hồ sơ hỗn hợp; chọn loại cụ thể giúp nhận số hiệu và phân đoạn chính xác hơn.
PDFEX chạy trên Windows 10/11, không cần cài Python. Giải nén và chạy — OCR engine (Tesseract) và công cụ xử lý PDF đã được đóng gói sẵn. Dữ liệu lưu trên máy bạn; phù hợp môi trường yêu cầu bảo mật hồ sơ.
Dùng thử miễn phí trước khi mua. Mua license trực tuyến qua PayShop — thanh toán VietQR, nhận key tự động.
Tên file đầu ra tuân theo mẫu chuẩn:
MãĐV_LoạiVB_Phông_PhiênBản_NgàyScan_STT.pdf
Ví dụ: H38.141_QĐ_000068_v1_20260607_000001.pdf
Đọc được số hiệu, trích yếu trên văn bản UBND và cơ quan nhà nước
Xử lý hồ sơ hỗn hợp QĐ, CV, TTr, NQ… không cần phân loại trước
Đồng nhất theo mẫu cấu hình, sẵn sàng nộp lưu trữ
Kiểm tra, in ấn và tích hợp phần mềm quản lý hồ sơ khác
Xem lại và tải lại kết quả các lần xử lý trước
Không cần Python — Tesseract và Poppler đã đóng gói sẵn