Konwertuj PDF na HTML za pomocą C++

PDF to standardowy format dokumentów, który jest szeroko stosowany do wymiany dokumentów między osobami fizycznymi i różnymi organizacjami. Mimo że jest popularny, nie zawsze może być idealnym wyborem do wyświetlania treści. Na przykład na stronach internetowych HTML jest lepszym wyborem, jeśli chodzi o bardziej satysfakcjonujące wrażenia użytkownika. Jeśli chcesz wyświetlić zawartość PDF na stronie internetowej, pomocne może okazać się przekonwertowanie jej do formatu HTML. W związku z tym w tym artykule dowiesz się, jak konwertować dokumenty PDF do formatu HTML za pomocą C++.

C++ API do konwersji dokumentów PDF do formatu HTML

Aspose.PDF for C++ to biblioteka C++, która umożliwia tworzenie, odczytywanie i aktualizowanie dokumentów PDF. Ponadto API obsługuje konwersję plików PDF do formatu HTML. Możesz zainstalować API przez NuGet lub pobrać bezpośrednio z sekcji downloads.

PM> Install-Package Aspose.PDF.Cpp

Konwertuj dokumenty PDF do formatu HTML za pomocą C++

Konwersja dokumentu PDF do formatu HTML to pestka dzięki Aspose.PDF for C++ API. Możesz przeprowadzić konwersję za pomocą zaledwie dwóch linii kodu. Aby przekonwertować dokument PDF na format HTML, wykonaj czynności podane poniżej.

Poniższy przykładowy kod pokazuje, jak konwertować dokumenty PDF do formatu HTML przy użyciu języka C++.

// Otwórz źródłowy dokument PDF
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// Zapisz plik HTML
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);

Źródłowy plik PDF

Źródłowy plik PDF użyty w przykładowym kodzie.

Wyjściowy plik HTML

Wyjściowy plik HTML wygenerowany przez przykładowy kod

Konwertuj dokumenty PDF do formatu HTML z dodatkowymi opcjami za pomocą C++

Aspose.PDF for C++ API zapewnia możliwość dostosowania HTML generowanego przez proces konwersji. W tym celu API oferuje klasę HtmlSaveOptions. Poniżej przedstawiono niektóre opcje udostępniane przez klasę HtmlSaveOptions.

Poniżej przedstawiono kroki konwersji dokumentu PDF do formatu HTML z dodatkowymi opcjami.

Poniżej znajduje się przykładowy kod C++, który demonstruje użycie klasy HtmlSaveOptions w celu dostosowania danych wyjściowych HTML.

// Otwórz źródłowy dokument PDF
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// Utwórz wystąpienie klasy HtmlSaveOptions
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();

// Ustaw żądane opcje
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;

// Zapisz plik HTML
pdfDocument->Save(u"OutputDirectory\\output.html", options);

Uzyskaj bezpłatną licencję

Możesz wypróbować interfejs API bez ograniczeń ewaluacyjnych, prosząc o bezpłatną licencję tymczasową.

Wniosek

W tym artykule nauczyłeś się konwertować dokumenty PDF do formatu HTML za pomocą C++. Ponadto nauczyłeś się, jak korzystać z dodatkowych opcji udostępnianych przez API Aspose.PDF for C++ w celu dostosowania wygenerowanego kodu HTML. Interfejs API zapewnia wiele dodatkowych funkcji do automatyzacji zadań związanych z plikami PDF. Możesz szczegółowo zapoznać się z interfejsem API, korzystając z oficjalnej dokumentacji. Jeśli masz jakieś pytania, skontaktuj się z nami na darmowym forum pomocy.

Zobacz też