Chuyển đổi Word sang PDF thường được sử dụng trước khi tài liệu được chia sẻ. Có sẵn nhiều trình chuyển đổi Word sang PDF trực tuyến khác nhau cho phép bạn chuyển đổi một hoặc một số lượng tài liệu Word hạn chế. Tuy nhiên, với các giải pháp tạo báo cáo và tự động hóa MS Word mới nổi, chuyển đổi Word sang PDF tự động đã trở thành một phần thiết yếu của hệ thống. Hơn nữa, việc chuyển đổi hàng loạt DOC/DOCX sang PDF cần được thực hiện tự động để giảm thiểu thời gian và công sức. Theo dõi các tình huống như vậy, tôi sẽ chỉ cho bạn cách tự động hóa quá trình chuyển đổi tài liệu Word DOC hoặc DOCX sang PDF theo chương trình trong Java.
Kịch bản chuyển đổi từ Java sang PDF
Bạn sẽ tìm hiểu về chuyển đổi Word (DOC/DOCX) sang PDF sau đây trong bài viết này.
- Chuyển Word sang PDF trong Java
- Chuyển đổi các trang đã chọn của Word DOC/DOCX thành PDF trong Java
- Chuyển đổi Word sang PDF bằng một Tiêu chuẩn PDF cụ thể như PDF 1.5, PDF/A-1a, v.v.
- Chuyển đổi Word sang PDF với nén hình ảnh/văn bản trong Java
- Chuyển đổi Word sang PDF với chất lượng JPEG tùy chỉnh cho hình ảnh trong Java
API chuyển đổi từ Java sang PDF
Để chuyển đổi Word DOCX/DOC sang PDF, chúng ta sẽ sử dụng Aspose.Words for Java là API tự động hóa Word mạnh mẽ để làm việc với các định dạng xử lý văn bản phổ biến. Bạn có thể tải xuống Aspose.Words for Java hoặc cài đặt nó trong ứng dụng dựa trên Maven của mình bằng các cấu hình sau.
Kho:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
phụ thuộc:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>20.1</version>
<classifier>jdk17</classifier>
</dependency>
Chuyển đổi Word DOC/DOCX sang PDF trong Java
Để chuyển đổi tài liệu Word sang PDF, bạn chỉ cần tải tài liệu Word và lưu nó với phần mở rộng “.pdf”. Sau đây là các bước để chuyển đổi DOCX/DOC sang PDF trong Java.
- Tải tài liệu Word bằng lớp Document.
- Lưu tài liệu dưới dạng PDF bằng phương pháp Document.save().
Mẫu mã sau đây cho biết cách chuyển đổi Word DOC thành PDF trong Java.
// Tải tài liệu Word từ đĩa
Document doc = new Document("word.docx");
// Lưu dưới dạng PDF
doc.save("output.pdf");
Tài liệu văn bản
Tài liệu PDF
Chuyển đổi các trang đã chọn của Word DOC/DOCX sang PDF trong Java
Trong trường hợp bạn chỉ muốn chuyển đổi một số trang chọn lọc của Word sang PDF, Bạn có thể thực hiện bằng cách sử dụng lớp PdfSaveOptions. Bạn có thể chuyển đổi N trang đầu tiên hoặc một dải trang bằng cách chỉ định chỉ mục của trang bắt đầu.
Sau đây là các bước để chuyển đổi các trang đã chọn của Word DOCX/DOC sang PDF trong Java.
- Tải tài liệu Word bằng lớp Document.
- Tạo một thể hiện của lớp PdfSaveOptions.
- Đặt chỉ mục của trang bắt đầu và số lượng trang để chuyển đổi.
- Lưu tài liệu Word dưới dạng PDF bằng phương pháp Document.save().
Mẫu mã sau đây cho biết cách chuyển đổi các trang đã chọn của Word DOC/DOCX sang PDF trong Java.
// Tải tài liệu Word từ đĩa
Document doc = new Document("word.docx");
PdfSaveOptions options = new PdfSaveOptions();
// Chuyển đổi 3 trang bắt đầu từ chỉ mục 1 trong đó 0 là chỉ mục của trang đầu tiên
options.setPageIndex(1);
options.setPageCount(3);
// Lưu từ dưới dạng PDF
doc.save("output.pdf", options);
Chuyển đổi Word DOC/DOCX thành tiêu chuẩn PDF cụ thể trong Java
Có nhiều tiêu chuẩn PDF khác nhau mà một tài liệu PDF có thể tuân thủ, chẳng hạn như PDF/A-1a, PDF 1.5, v.v. Trong trường hợp bạn muốn chuyển đổi tài liệu Word sang một tiêu chuẩn PDF cụ thể, bạn có thể chỉ định nó bằng cách sử dụng PdfCompliance .
Mẫu mã sau đây cho biết cách chuyển đổi Word DOCX sang PDF với một tiêu chuẩn PDF cụ thể trong Java.
// Tải tài liệu Word từ đĩa
Document doc = new Document("word.docx");
// Đặt tuân thủ PDFSaveOption thành PDF15
PdfSaveOptions options = new PdfSaveOptions();
options.setCompliance(PdfCompliance.PDF_15);
// Chuyển đổi từ sang PDF
doc.save("output.pdf", options);
Chuyển đổi Word sang PDF bằng Nén văn bản hoặc hình ảnh trong Java
Bạn cũng có thể giảm kích thước của tài liệu PDF thu được bằng cách nén văn bản hoặc hình ảnh trong tài liệu Word. Bạn có thể áp dụng các cách nén sau trong chuyển đổi Word sang PDF bằng Aspose.Words for Java.
Tùy chọn nén văn bản
Aspose.Words for Java cung cấp lớp PdfTextCompression với các tùy chọn nén văn bản sau:
- Không: Không nén văn bản.
- Phẳng: Nén phẳng (ZIP).
Nén hình ảnh
Các tùy chọn nén hình ảnh có sẵn trong lớp PdfImageCompression.
- Tự động: Chế độ nén thích hợp nhất cho mọi hình ảnh được chọn tự động.
- Jpeg: Hình ảnh được chuyển đổi sang định dạng JPEG (không hỗ trợ độ trong suốt).
Mẫu mã sau đây cho biết cách chuyển đổi Word DOCX sang PDF bằng cách áp dụng nén văn bản và hình ảnh trong Java.
// Tải tài liệu Word từ đĩa
Document doc = new Document("word.docx");
PdfSaveOptions options = new PdfSaveOptions();
// Nén văn bản và hình ảnh
options.setTextCompression(PdfTextCompression.FLATE);
options.setImageCompression(PdfImageCompression.AUTO);
// Lưu từ dưới dạng PDF
doc.save("output.pdf", options);
Chuyển đổi Word sang PDF với chất lượng JPEG trong Java
Bạn cũng có thể tùy chỉnh và kiểm soát chất lượng JPEG trong chuyển đổi Word sang PDF. PdfSaveOptions.setJpegQuality được sử dụng để đặt chất lượng JPEG có thể từ 0 (chất lượng kém nhất với độ nén tối đa) thành 100 (chất lượng tốt nhất với độ nén tối thiểu).
Mẫu mã sau đây cho biết cách chỉ định chất lượng JPEG trong khi chuyển đổi Word DOCX sang PDF trong Java.
// Tải tài liệu Word từ đĩa
Document doc = new Document("word.docx");
// Đặt chất lượng Jpeg
PdfSaveOptions options = new PdfSaveOptions();
options.setJpegQuality(100);
// Chuyển đổi từ sang PDF
doc.save("output.pdf", options);
Dùng thử miễn phí Aspose.Words for Java
Bạn có thể nhận giấy phép tạm thời miễn phí để thử và sử dụng Aspose.Words for Java.
Sự kết luận
Trong bài viết này, bạn đã học cách chuyển đổi Word DOCX hoặc DOC sang PDF bằng Java. Hơn nữa, bạn đã thấy cách tùy chỉnh chuyển đổi Word sang PDF trong các tình huống khác nhau. Bạn có thể khám phá thêm về Aspose.Words for Java bằng cách sử dụng tài liệu.
Những bài viết liên quan
- Word DOC/DOCX sang PDF trong C#
- PDF sang Excel trong C#
- Tài liệu PDF sang MS Word trong Java
- Word để Markdown trong Java
- Chuyển đổi Word sang EPUB trong Java
- Chuyển HTML sang Word trong Java
- Tệp TXT sang PDF trong Java
- Tệp PDF thành văn bản trong Python
- XLSX sang JSON trong Java
- Excel sang JSON trong Java
- DOCX sang JSON trong Java
- DOC sang JSON trong Java
- Chuyển từ sang JSON trong Java
- TXT sang JSON trong Java
- JSON sang PDF trong Python
- Excel sang JSON trong Java
- TXT sang JSON trong Python
- PNG sang Word trong C# .NET
- JPG sang Word trong C# .NET
- Image to Word trong C#
- Word sang HTML trong C#
- Từ DOCX sang Markdown trong Java
- Trích xuất hình ảnh từ Word DOC trong Java
Thông tin: Aspose cung cấp một ứng dụng web trực tuyến miễn phí cho phép bạn xem các tệp PDF trực tuyến, một ứng dụng khác cho phép bạn chuyển đổi các tệp PDF thành video và một ứng dụng khác cho phép bạn chỉnh sửa các tệp PDF trực tuyến.
Thông tin: Bạn có thể quan tâm đến một Java API khác, đặc biệt là một API cho phép các nhà phát triển và ứng dụng chuyển đổi PowerPoint sang PDF – Aspose.Slides for Python. Và bạn cũng có thể muốn xem Aspose Trình chuyển đổi PowerPoint sang PDF vì đây là quá trình triển khai trực tiếp tài liệu PowerPoint sang PDF.