Chuyển Word sang PDF trong Java

Chuyển đổi Word sang PDF thường được sử dụng trước khi tài liệu được chia sẻ. Có sẵn nhiều trình chuyển đổi Word sang PDF trực tuyến khác nhau cho phép bạn chuyển đổi một hoặc một số lượng tài liệu Word hạn chế. Tuy nhiên, với các giải pháp tạo báo cáo và tự động hóa MS Word mới nổi, chuyển đổi Word sang PDF tự động đã trở thành một phần thiết yếu của hệ thống. Hơn nữa, việc chuyển đổi hàng loạt DOC/DOCX sang PDF cần được thực hiện tự động để giảm thiểu thời gian và công sức. Theo dõi các tình huống như vậy, tôi sẽ chỉ cho bạn cách tự động hóa quá trình chuyển đổi tài liệu Word DOC hoặc DOCX sang PDF theo chương trình trong Java.

Kịch bản chuyển đổi từ Java sang PDF

Bạn sẽ tìm hiểu về chuyển đổi Word (DOC/DOCX) sang PDF sau đây trong bài viết này.

API chuyển đổi từ Java sang PDF

Để chuyển đổi Word DOCX/DOC sang PDF, chúng ta sẽ sử dụng Aspose.Words for Java là API tự động hóa Word mạnh mẽ để làm việc với các định dạng xử lý văn bản phổ biến. Bạn có thể tải xuống Aspose.Words for Java hoặc cài đặt nó trong ứng dụng dựa trên Maven của mình bằng các cấu hình sau.

Kho:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

phụ thuộc:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>20.1</version>
    <classifier>jdk17</classifier>
</dependency>

Chuyển đổi Word DOC/DOCX sang PDF trong Java

Để chuyển đổi tài liệu Word sang PDF, bạn chỉ cần tải tài liệu Word và lưu nó với phần mở rộng “.pdf”. Sau đây là các bước để chuyển đổi DOCX/DOC sang PDF trong Java.

  • Tải tài liệu Word bằng lớp Document.
  • Lưu tài liệu dưới dạng PDF bằng phương pháp Document.save().

Mẫu mã sau đây cho biết cách chuyển đổi Word DOC thành PDF trong Java.

// Tải tài liệu Word từ đĩa
Document doc = new Document("word.docx");
// Lưu dưới dạng PDF
doc.save("output.pdf");

Tài liệu văn bản

DOC DOCX sang PDF trong Java

Tài liệu PDF

DOCX sang PDF

Chuyển đổi các trang đã chọn của Word DOC/DOCX sang PDF trong Java

Trong trường hợp bạn chỉ muốn chuyển đổi một số trang chọn lọc của Word sang PDF, Bạn có thể thực hiện bằng cách sử dụng lớp PdfSaveOptions. Bạn có thể chuyển đổi N trang đầu tiên hoặc một dải trang bằng cách chỉ định chỉ mục của trang bắt đầu.

Sau đây là các bước để chuyển đổi các trang đã chọn của Word DOCX/DOC sang PDF trong Java.

  • Tải tài liệu Word bằng lớp Document.
  • Tạo một thể hiện của lớp PdfSaveOptions.
  • Đặt chỉ mục của trang bắt đầu và số lượng trang để chuyển đổi.
  • Lưu tài liệu Word dưới dạng PDF bằng phương pháp Document.save().

Mẫu mã sau đây cho biết cách chuyển đổi các trang đã chọn của Word DOC/DOCX sang PDF trong Java.

// Tải tài liệu Word từ đĩa
Document doc = new Document("word.docx");
PdfSaveOptions options = new PdfSaveOptions();
// Chuyển đổi 3 trang bắt đầu từ chỉ mục 1 trong đó 0 là chỉ mục của trang đầu tiên 
options.setPageIndex(1);
options.setPageCount(3);
// Lưu từ dưới dạng PDF
doc.save("output.pdf", options);

Chuyển đổi Word DOC/DOCX thành tiêu chuẩn PDF cụ thể trong Java

Có nhiều tiêu chuẩn PDF khác nhau mà một tài liệu PDF có thể tuân thủ, chẳng hạn như PDF/A-1a, PDF 1.5, v.v. Trong trường hợp bạn muốn chuyển đổi tài liệu Word sang một tiêu chuẩn PDF cụ thể, bạn có thể chỉ định nó bằng cách sử dụng PdfCompliance .

Mẫu mã sau đây cho biết cách chuyển đổi Word DOCX sang PDF với một tiêu chuẩn PDF cụ thể trong Java.

// Tải tài liệu Word từ đĩa
Document doc = new Document("word.docx");
// Đặt tuân thủ PDFSaveOption thành PDF15
PdfSaveOptions options = new PdfSaveOptions();
options.setCompliance(PdfCompliance.PDF_15);
// Chuyển đổi từ sang PDF
doc.save("output.pdf", options);

Chuyển đổi Word sang PDF bằng Nén văn bản hoặc hình ảnh trong Java

Bạn cũng có thể giảm kích thước của tài liệu PDF thu được bằng cách nén văn bản hoặc hình ảnh trong tài liệu Word. Bạn có thể áp dụng các cách nén sau trong chuyển đổi Word sang PDF bằng Aspose.Words for Java.

Tùy chọn nén văn bản

Aspose.Words for Java cung cấp lớp PdfTextCompression với các tùy chọn nén văn bản sau:

  • Không: Không nén văn bản.
  • Phẳng: Nén phẳng (ZIP).

Nén hình ảnh

Các tùy chọn nén hình ảnh có sẵn trong lớp PdfImageCompression.

  • Tự động: Chế độ nén thích hợp nhất cho mọi hình ảnh được chọn tự động.
  • Jpeg: Hình ảnh được chuyển đổi sang định dạng JPEG (không hỗ trợ độ trong suốt).

Mẫu mã sau đây cho biết cách chuyển đổi Word DOCX sang PDF bằng cách áp dụng nén văn bản và hình ảnh trong Java.

// Tải tài liệu Word từ đĩa
Document doc = new Document("word.docx");
PdfSaveOptions options = new PdfSaveOptions();
// Nén văn bản và hình ảnh
options.setTextCompression(PdfTextCompression.FLATE);
options.setImageCompression(PdfImageCompression.AUTO);
// Lưu từ dưới dạng PDF
doc.save("output.pdf", options);

Chuyển đổi Word sang PDF với chất lượng JPEG trong Java

Bạn cũng có thể tùy chỉnh và kiểm soát chất lượng JPEG trong chuyển đổi Word sang PDF. PdfSaveOptions.setJpegQuality được sử dụng để đặt chất lượng JPEG có thể từ 0 (chất lượng kém nhất với độ nén tối đa) thành 100 (chất lượng tốt nhất với độ nén tối thiểu).

Mẫu mã sau đây cho biết cách chỉ định chất lượng JPEG trong khi chuyển đổi Word DOCX sang PDF trong Java.

// Tải tài liệu Word từ đĩa
Document doc = new Document("word.docx");
// Đặt chất lượng Jpeg
PdfSaveOptions options = new PdfSaveOptions();
options.setJpegQuality(100);
// Chuyển đổi từ sang PDF
doc.save("output.pdf", options);

Dùng thử miễn phí Aspose.Words for Java

Bạn có thể nhận giấy phép tạm thời miễn phí để thử và sử dụng Aspose.Words for Java.

Sự kết luận

Trong bài viết này, bạn đã học cách chuyển đổi Word DOCX hoặc DOC sang PDF bằng Java. Hơn nữa, bạn đã thấy cách tùy chỉnh chuyển đổi Word sang PDF trong các tình huống khác nhau. Bạn có thể khám phá thêm về Aspose.Words for Java bằng cách sử dụng tài liệu.

Những bài viết liên quan

Thông tin: Aspose cung cấp một ứng dụng web trực tuyến miễn phí cho phép bạn xem các tệp PDF trực tuyến, một ứng dụng khác cho phép bạn chuyển đổi các tệp PDF thành video và một ứng dụng khác cho phép bạn chỉnh sửa các tệp PDF trực tuyến.

Thông tin: Bạn có thể quan tâm đến một Java API khác, đặc biệt là một API cho phép các nhà phát triển và ứng dụng chuyển đổi PowerPoint sang PDF – Aspose.Slides for Python. Và bạn cũng có thể muốn xem Aspose Trình chuyển đổi PowerPoint sang PDF vì đây là quá trình triển khai trực tiếp tài liệu PowerPoint sang PDF.