Chuyển đổi PDF sang HTML bằng C ++

PDF là định dạng tài liệu tiêu chuẩn được sử dụng rộng rãi để trao đổi tài liệu giữa các cá nhân và tổ chức khác nhau. Mặc dù nó phổ biến, nó có thể không phải lúc nào cũng là lựa chọn lý tưởng để hiển thị nội dung. Ví dụ: trên các trang web, HTML là lựa chọn tốt hơn để có trải nghiệm người dùng hài lòng hơn. Nếu bạn muốn hiển thị nội dung PDF trên một trang web, thì việc chuyển đổi nó sang HTML có thể hữu ích. Về vấn đề này, bài viết này sẽ hướng dẫn bạn cách chuyển đổi tài liệu PDF sang định dạng HTML bằng C ++.

API C ++ để chuyển đổi tài liệu PDF sang định dạng HTML

Aspose.PDF for C ++ là thư viện C ++ cho phép bạn tạo, đọc và cập nhật tài liệu PDF. Hơn nữa, API hỗ trợ chuyển đổi các tệp PDF sang định dạng HTML. Bạn có thể cài đặt API thông qua NuGet hoặc tải xuống trực tiếp từ phần tải xuống.

PM> Install-Package Aspose.PDF.Cpp

Chuyển đổi tài liệu PDF sang định dạng HTML bằng C ++

Chuyển đổi tài liệu PDF sang định dạng HTML thật dễ dàng với API Aspose.PDF cho C ++. Bạn có thể thực hiện chuyển đổi chỉ với hai dòng mã. Để chuyển đổi tài liệu PDF sang định dạng HTML, vui lòng làm theo các bước dưới đây.

Đoạn mã mẫu sau đây cho thấy cách chuyển đổi tài liệu PDF sang định dạng HTML bằng C ++.

// Mở tài liệu PDF nguồn
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// Lưu tệp HTML
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);

Tệp PDF nguồn

Tệp PDF nguồn được sử dụng trong mã mẫu.

Đầu ra tệp HTML

Đầu ra tệp HTML được tạo bởi mã mẫu

Chuyển đổi tài liệu PDF sang định dạng HTML với các tùy chọn bổ sung bằng C ++

API Aspose.PDF cho C ++ cung cấp cho bạn khả năng tùy chỉnh HTML được tạo ra bởi quá trình chuyển đổi. Đối với điều này, API cung cấp lớp HtmlSaveOptions. Sau đây là một số tùy chọn được cung cấp bởi lớp HtmlSaveOptions.

  • FontSavingMode: Nó được sử dụng để đặt chế độ lưu phông chữ được sử dụng trong quá trình chuyển đổi. Enum FontSavingModes được sử dụng để đặt giá trị của nó.
  • RasterImagesSavingMode: Nó được sử dụng để đặt cách xử lý hình ảnh raster trong quá trình chuyển đổi. Enum RasterImagesSavingModes được sử dụng để đặt giá trị của nó.
  • LettersPositioningMethod: Nó đặt vị trí của các chữ cái trong từ. Enum LettersPositioningMethods được sử dụng để đặt giá trị của nó.
  • SpecialFolderForAllImages: Nó được sử dụng để thiết lập đường dẫn nơi ảnh sẽ được lưu.
  • SplitIntoPages: Nó đặt xem mỗi trang của PDF nên được chuyển đổi thành một trang HTML riêng biệt hay toàn bộ tài liệu nên được chuyển đổi thành một tệp HTML.
  • SplitCssIntoPages: Khi SplitIntoPages được đặt thành true, SplitCssIntoPages sẽ đặt liệu CSS nên được lưu dưới dạng một tệp duy nhất hay dưới dạng tệp riêng biệt cho mỗi trang HTML.

Sau đây là các bước để chuyển đổi một tài liệu PDF sang định dạng HTML với các tùy chọn bổ sung.

Sau đây là mã mẫu C ++ minh họa việc sử dụng lớp HtmlSaveOptions để tùy chỉnh đầu ra HTML.

// Mở tài liệu PDF nguồn
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// Tạo một phiên bản của lớp HtmlSaveOptions
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();

// Đặt các tùy chọn mong muốn
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;

// Lưu tệp HTML
pdfDocument->Save(u"OutputDirectory\\output.html", options);

Nhận giấy phép miễn phí

Bạn có thể dùng thử API mà không có giới hạn đánh giá bằng cách yêu cầu giấy phép tạm thời miễn phí.

Sự kết luận

Trong bài này, bạn đã học cách chuyển đổi tài liệu PDF sang định dạng HTML bằng C ++. Hơn nữa, bạn đã học cách sử dụng các tùy chọn bổ sung được cung cấp bởi API Aspose.PDF cho C ++ để tùy chỉnh HTML được tạo. API cung cấp nhiều tính năng bổ sung để tự động hóa các tác vụ liên quan đến PDF của bạn. Bạn có thể khám phá API chi tiết bằng cách sử dụng tài liệu chính thức. Nếu bạn có bất kỳ câu hỏi nào, vui lòng liên hệ với chúng tôi trên diễn đàn hỗ trợ miễn phí.

Xem thêm