PDFEX

PDFEX — Bóc tách, số hóa hồ sơ lưu trữ

Biến một file PDF scan nhiều văn bản thành hàng trăm tài liệu riêng lẻ — tự động, đúng quy chuẩn đặt tên, kèm bảng kê đầy đủ.

Windows 10/11 OCR tiếng Việt QĐ · CV · TTr · NQ HTML + JSON Chạy offline

Giá từ

50.000đ

Giới thiệu

Giải phóng hàng giờ bóc tách thủ công

Khi hồ sơ lưu trữ được scan thành một file PDF dài — hàng chục, hàng trăm văn bản nối liền — việc tách từng tài liệu, đặt tên file và lập bảng kê vẫn thường làm bằng tay. Tốn thời gian, dễ sót, khó đồng nhất quy tắc đặt tên.

PDFEX là phần mềm chuyên dụng giúp bóc tách và số hóa hồ sơ lưu trữ từ PDF scan. Chỉ cần kéo thả file, phần mềm tự OCR, nhận diện ranh giới từng văn bản (theo quốc hiệu, số hiệu, loại văn bản), tách thành file PDF riêng và xuất bảng kê chi tiết — sẵn sàng nộp lưu trữ hoặc import vào hệ thống quản lý.

Thiết kế cho văn bản hành chính Việt Nam

PDFEX hiểu cấu trúc văn bản UBND và các cơ quan nhà nước: Quyết định, Công văn, Tờ trình, Nghị quyết, Báo cáo, Biên bản, Chỉ thị… và nhiều loại khác. Chế độ Tự nhận diện phù hợp hồ sơ hỗn hợp; chọn loại cụ thể giúp nhận số hiệu và phân đoạn chính xác hơn.

Cài đặt đơn giản, làm việc offline

PDFEX chạy trên Windows 10/11, không cần cài Python. Giải nén và chạy — OCR engine (Tesseract) và công cụ xử lý PDF đã được đóng gói sẵn. Dữ liệu lưu trên máy bạn; phù hợp môi trường yêu cầu bảo mật hồ sơ.

Dùng thử miễn phí trước khi mua. Mua license trực tuyến qua PayShop — thanh toán VietQR, nhận key tự động.

Quy tắc đặt tên file

Tên file đầu ra tuân theo mẫu chuẩn:

MãĐV_LoạiVB_Phông_PhiênBản_NgàyScan_STT.pdf

Ví dụ: H38.141_QĐ_000068_v1_20260607_000001.pdf

Một lần xử lý — đủ bộ kết quả

Các file PDF đã tách (mỗi văn bản một file)
Bảng kê HTML mở offline được
report.json để tích hợp hệ thống khác
Tải ZIP một lần hoặc mở thư mục trực tiếp trên máy

Quy trình sử dụng

Nhập mã đơn vị (ví dụ H38.141) và thông tin phông, phiên bản, ngày scan.
Chọn loại văn bản hoặc để Tự nhận diện.
Kéo thả file PDF scan vào ứng dụng.
Bấm Phân tích — theo dõi tiến trình OCR và tách file.
Tải ZIP hoặc mở thư mục kết quả — xong.

Tính năng chính

OCR tiếng Việt chuyên biệt

Đọc được số hiệu, trích yếu trên văn bản UBND và cơ quan nhà nước

Tự nhận diện loại văn bản

Xử lý hồ sơ hỗn hợp QĐ, CV, TTr, NQ… không cần phân loại trước

Đặt tên file theo quy chuẩn

Đồng nhất theo mẫu cấu hình, sẵn sàng nộp lưu trữ

Bảng kê HTML + JSON

Kiểm tra, in ấn và tích hợp phần mềm quản lý hồ sơ khác

Lịch sử công việc

Xem lại và tải lại kết quả các lần xử lý trước

Chạy offline trên Windows

Không cần Python — Tesseract và Poppler đã đóng gói sẵn

Tải phần mềm

Phiên bản 8.0

Windows · PDFEX.zip · 74.8 MB

Tải về

Chọn gói

Gói 10 ngày

50.000đ

10 ngày · 1 máy

Đăng nhập để mua

Gói 1 tháng

100.000đ

30 ngày · 1 máy

Đăng nhập để mua

1 năm

200.000đ

1 năm · 1 máy

Đăng nhập để mua

Vĩnh viễn

500.000đ

Vĩnh viễn · 1 máy

Đăng nhập để mua

Câu hỏi thường gặp

PDFEX chuyên sâu cho bóc tách hồ sơ scan thành từng văn bản có cấu trúc, đúng ngữ cảnh hành chính Việt Nam — không phải công cụ chỉnh sửa PDF đa năng.

Mỗi key chỉ dùng trên một mã máy. Khi mua, bạn nhập mã máy từ PDFEX để hệ thống cấp key đúng thiết bị.

Mở PDFEX → biểu tượng chìa khóa → sao chép Mã máy (dạng XXXX-XXXX-XXXX-XXXX).

Thường trong vài phút sau khi chuyển khoản VietQR được xác nhận. Key hiện ngay trên trang thanh toán và dashboard.

Không. Bản phân phối đã đóng gói đầy đủ — giải nén và chạy trên Windows 10/11.

PDFEX — Bóc tách, số hóa hồ sơ lưu trữ

Giới thiệu

Giải phóng hàng giờ bóc tách thủ công

Thiết kế cho văn bản hành chính Việt Nam

Cài đặt đơn giản, làm việc offline

Quy tắc đặt tên file

Một lần xử lý — đủ bộ kết quả

Quy trình sử dụng

Tính năng chính

OCR tiếng Việt chuyên biệt

Tự nhận diện loại văn bản

Đặt tên file theo quy chuẩn

Bảng kê HTML + JSON

Lịch sử công việc

Chạy offline trên Windows

Tải phần mềm

Chọn gói

Gói 10 ngày

Gói 1 tháng

1 năm

Vĩnh viễn

Câu hỏi thường gặp

PDFEX khác gì phần mềm PDF thông thường?

License gắn máy là gì?

Làm sao lấy mã máy?

Thanh toán xong bao lâu có key?

Có cần cài Python hay Tesseract không?