Bạn thường có thể cần phải chuyển đổi một tệp PDF thành HTML để nhúng nó vào một trang web. Để thực hiện chuyển đổi này theo chương trình, bài viết này trình bày cách chuyển đổi tệp PDF sang HTML bằng Java. Hơn nữa, bạn sẽ học cách sử dụng các tùy chọn bổ sung để tùy chỉnh chuyển đổi PDF sang HTML.
- Java API để chuyển đổi PDF sang HTML
- Chuyển đổi tệp PDF sang HTML
- PDF sang HTML với các tùy chọn bổ sung
Java API để chuyển đổi PDF sang HTML
Để chuyển đổi tệp PDF sang HTML, chúng tôi sẽ sử dụng Aspose.PDF for Java. Đây là một API thao tác PDF giàu tính năng cho phép bạn tạo, sửa đổi và chuyển đổi các tệp PDF. Hơn nữa, nó cung cấp các phương pháp dễ sử dụng để chuyển đổi các trang PDF sang HTML. Bạn có thể tải xuống API hoặc cài đặt nó bằng cách sử dụng các cấu hình Maven sau.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.5</version>
</dependency>
Chuyển đổi PDF sang HTML trong Java
Sau đây là các bước để chuyển đổi một tệp PDF sang HTML bằng Java.
- Tải tài liệu PDF bằng lớp Tài liệu.
- Chuyển đổi PDF sang HTML bằng phương pháp Document.save (“pdf-to-html.html”, SaveFormat.Html).
Mẫu mã sau đây cho thấy cách chuyển đổi tệp PDF sang HTML.
// Tải tài liệu PDF nguồn
Document pdfDocument = new Document("PDFToHTML.pdf");
// Lưu tệp PDF dưới dạng HTML
pdfDocument.save("pdf-to-html.html", SaveFormat.Html);
Java PDF sang HTML với các tùy chọn bổ sung
Aspose.PDF for Java cũng cung cấp các tùy chọn bổ sung để tùy chỉnh chuyển đổi PDF sang HTML. Chẳng hạn như, bạn có thể nén hình ảnh, chia đầu ra thành nhiều trang HTML, chỉ định thư mục cho hình ảnh, v.v. Sau đây là các bước để chỉ định các tùy chọn bổ sung cho việc chuyển đổi PDF sang HTML.
- Tải tài liệu PDF bằng lớp Tài liệu.
- Tạo một thể hiện của lớp HtmlSaveOptions.
- Đặt các tùy chọn mong muốn như HtmlOptions.setSplitIntoPages (true) để chia nội dung HTML thành nhiều trang.
- Chuyển đổi PDF sang HTML bằng phương pháp Document.save (“pdf-to-html.html”, HtmlSaveOptions).
Mẫu mã sau đây cho thấy cách tùy chỉnh chuyển đổi PDF sang HTML.
// Tải tài liệu PDF nguồn
Document pdfDocument = new Document("PDFToHTML.pdf");
// Khởi tạo HTMLSaveOptions
HtmlSaveOptions htmlOptions = new HtmlSaveOptions();
// Chia đầu ra thành nhiều trang
htmlOptions.setSplitIntoPages(true);
// Lưu tệp PDF dưới dạng HTML
pdfDocument.save("pdf-to-html.html", htmlOptions);
Bạn có thể khám phá các tùy chọn khác bằng cách sử dụng các liên kết tài liệu sau.
- Tránh lưu hình ảnh ở định dạng SVG
- Nén hình ảnh SVG trong quá trình chuyển đổi
- Chỉ định Thư mục Hình ảnh
- Tạo các tệp tiếp theo chỉ với nội dung cơ thể
- Kết xuất văn bản trong suốt
- Kết xuất các lớp tài liệu PDF
- Loại trừ Tài nguyên Phông chữ
Nhận giấy phép miễn phí
Bạn có thể sử dụng Aspose.PDF for Java mà không có giới hạn đánh giá bằng cách sử dụng giấy phép tạm thời. Nhận của bạn ngay bây giờ.
Sự kết luận
Trong bài viết này, bạn đã học cách chuyển đổi tệp PDF sang HTML bằng Java. Hơn nữa, bạn đã thấy cách sử dụng các tùy chọn khác nhau để tùy chỉnh chuyển đổi PDF sang HTML. Bạn có thể khám phá thêm về API bằng cách sử dụng tài liệu. Ngoài ra, bạn có thể đăng các truy vấn của mình lên diễn đàn của chúng tôi.