PDF в HTML

Преобразование PDF в HTML — это широко используемая функция, которую можно реализовать с помощью различных средств, например программного обеспечения, инструментов и онлайн-сервисов. Иногда вам нужно преобразовать содержимое PDF таким образом, чтобы его можно было отобразить в браузере или сделать частью вашего веб-приложения. Преобразование PDF в HTML позволяет выполнить это требование, если содержимое PDF отображается с тегами HTML с аналогичным стилем и форматированием. Благодаря Aspose вы теперь можете реализовать эту функциональность в своем настольном или веб-приложении, используя Aspose.PDF для .NET. API позволяет вам конвертировать ваши PDF-документы в HTML, используя несколько строк кода, и не только это, но также позволяет вам указывать различные параметры форматирования и стиля во время преобразования. В следующем разделе поста вы найдете полное руководство по использованию Aspose.PDF для .NET для преобразования PDF в HTML.

Преобразование PDF в HTML в .NET

Простое преобразование PDF в HTML можно выполнить, загрузив документ PDF и сохранив его как HTML с помощью HtmlSaveOptions. В следующем примере показано не только преобразование, но и спецификация требования, при котором вы можете сохранять изображения в растровом формате:

// Полные примеры и файлы данных см. на странице https://github.com/aspose-pdf/Aspose.PDF-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion_PDFToHTMLFormat();

// Исходный PDF-файл
Document doc = new Document(dataDir + "input.pdf");

// Создайте HtmlSaveOption с проверенной функцией
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.FixedLayout = true;
saveOptions.SplitIntoPages = false;
saveOptions.RasterImagesSavingMode = HtmlSaveOptions.RasterImagesSavingModes.AsExternalPngFilesReferencedViaSvg;
              
// Сохраните вывод в формате HTML
doc.Save( dataDir + "SaveImages_out.html", saveOptions);

История не заканчивается здесь. Aspose.PDF для .NET предлагает обширные и наиболее требовательные функции, которые не только повышают удобство использования, но и дают вам полный контроль над процессом преобразования по вашему желанию. Вы можете просмотреть следующие выдающиеся и исчерпывающие статьи в документации по API, чтобы понять полный набор функций в этой области, т.е. PDF в HTML:

В дополнение к вышеперечисленным функциям Aspose.PDF для .NET 19.8 содержит новое усовершенствование, позволяющее сохранять PDF в HTML с полной шириной содержимого. Давайте посмотрим на использование этой новой функции:

Преобразование PDF в HTML с полной шириной содержимого

Последняя версия API позволяет преобразовывать PDF в HTML с полной шириной содержимого, тогда как содержимое HTML используется для выравнивания по левому краю. Свойство FlowLayoutParagraphFullWidth класса HtmlSaveOptions позволяет добиться этого, как показано в следующем примере кода.

// Полные примеры и файлы данных см. на странице https://github.com/aspose-pdf/Aspose.PDF-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.FixedLayout = (false);
saveOptions.FlowLayoutParagraphFullWidth = true;
Document doc = new Document(dataDir + "FlowLayoutParagraphFullWidth.Pdf");
doc.Save(dataDir + "FlowLayoutParagraphFullWidth_out.html", saveOptions);

Дальнейшие улучшения и полезные исправления

Фактор удобства использования API становится сильнее благодаря следующему списку полезных улучшений, которые API привносит с собой в [v19.8](https://docs.aspose.com/display/pdfnet/Aspose.PDF+for+.NET+19.8 +Release+Notes “Aspose.PDF for .NET 19.8 Release Notes”):

  • Добавление функциональности таблицы дополнительно исправлено
  • Подстановка шрифтов улучшена
  • Потребление памяти при добавлении HTML в PDF дополнительно импровизировано.
  • Преобразование PDF в изображение улучшено
  • Преобразование XML в PDF улучшено
  • Улучшено преобразование PDF в DOC/DOCX.
  • Сценарии добавления и обработки текста были импровизированы.

Мы надеемся, что рассмотрели все аспекты преобразования PDF в HTML в приведенном выше руководстве. Однако, если у вас все еще есть какие-либо вопросы, пожалуйста, сообщите нам об этом. Как всегда, не пропустите одно обновление об API Aspose. Мы скоро вернемся с новой версией API с интересными функциями.