Перетворення PDF на HTML за допомогою C++

PDF – це стандартний формат документів, який широко використовується для обміну документами між окремими особами та різними організаціями. Незважаючи на те, що він популярний, він не завжди може бути ідеальним вибором для показу вмісту. Наприклад, на веб-сторінках HTML є кращим вибором для більшого задоволення користувачів. Якщо ви хочете відобразити PDF-вміст на веб-сайті, то конвертація його в HTML може виявитися корисною. Зважаючи на це, ця стаття навчить вас конвертувати документи PDF у формат HTML за допомогою C++.

C++ API для перетворення PDF-документів у формат HTML

Aspose.PDF for C++ — це бібліотека C++, яка дозволяє створювати, читати та оновлювати документи PDF. Крім того, API підтримує перетворення файлів PDF у формат HTML. Ви можете встановити API через NuGet або завантажити його безпосередньо з розділу завантажень.

PM> Install-Package Aspose.PDF.Cpp

Перетворіть PDF-документи у формат HTML за допомогою C++

З API Aspose.PDF for C++ конвертувати PDF-документ у формат HTML легко. Ви можете виконати перетворення лише за допомогою двох рядків коду. Щоб конвертувати PDF-документ у формат HTML, виконайте наведені нижче дії.

У наведеному нижче прикладі коду показано, як конвертувати документи PDF у формат HTML за допомогою C++.

// Відкрийте вихідний документ PDF
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// Збережіть файл HTML
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);

Вихідний файл PDF

Вихідний PDF-файл, використаний у прикладі коду.

Вихідний файл HTML

Вихідний HTML-файл, згенерований зразком коду

Перетворіть PDF-документи у формат HTML із додатковими параметрами за допомогою C++

API Aspose.PDF for C++ надає вам можливість налаштувати HTML, створений у процесі перетворення. Для цього API пропонує клас HtmlSaveOptions. Нижче наведено деякі параметри, надані класом HtmlSaveOptions.

  • FontSavingMode: використовується для встановлення режиму збереження шрифту під час перетворення. Перелік FontSavingModes використовується для встановлення його значення.
  • RasterImagesSavingMode: використовується для встановлення способу обробки растрових зображень під час перетворення. Перелік RasterImagesSavingModes використовується для встановлення його значення.
  • LettersPositioningMethod: встановлює розташування літер у словах. Перелік LettersPositioningMethods використовується для встановлення його значення.
  • SpecialFolderForAllImages: використовується для встановлення шляху, де будуть зберігатися зображення.
  • SplitIntoPages: визначає, чи кожна сторінка PDF-файлу має бути перетворена як окрема сторінка HTML, чи весь документ має бути перетворений в один файл HTML.
  • SplitCssIntoPages: якщо для параметра SplitIntoPages встановлено значення true, SplitCssIntoPages визначає, чи слід зберігати CSS як один файл чи як окремий файл для кожної сторінки HTML.

Нижче наведено кроки для перетворення документа PDF у формат HTML із додатковими параметрами.

Нижче наведено приклад коду C++, який демонструє використання класу HtmlSaveOptions для налаштування виведення HTML.

// Відкрийте вихідний документ PDF
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// Створіть екземпляр класу HtmlSaveOptions
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();

// Встановіть потрібні параметри
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;

// Збережіть файл HTML
pdfDocument->Save(u"OutputDirectory\\output.html", options);

Безкоштовний конвертер PDF у HTML для C++

Ви можете отримати безкоштовну тимчасову ліцензію і насолоджуватися конвертацією PDF-файлів у HTML без будь-яких обмежень.

Ознайомтеся з бібліотекою C++ PDF

Наша бібліотека C++ PDF надає багато додаткових функцій для автоматизації ваших завдань, пов’язаних із PDF. Ви можете вивчити його детально, використовуючи офіційну документацію. Якщо у вас виникли запитання, зв’яжіться з нами на безкоштовному форумі підтримки.

Висновок

У цій статті ви дізналися, як конвертувати документи PDF у формат HTML за допомогою C++. Крім того, ви дізналися, як використовувати додаткові параметри, надані API Aspose.PDF for C++, щоб налаштувати згенерований HTML.

Дивись також