Преобразование PDF в HTML — это широко используемая функция, которую можно реализовать с помощью различных средств, например программного обеспечения, инструментов и онлайн-сервисов. Иногда вам нужно преобразовать содержимое PDF таким образом, чтобы его можно было отобразить в браузере или сделать частью вашего веб-приложения. Преобразование PDF в HTML позволяет выполнить это требование, если содержимое PDF отображается с тегами HTML с аналогичным стилем и форматированием. Благодаря Aspose вы теперь можете реализовать эту функциональность в своем настольном или веб-приложении, используя Aspose.PDF для .NET. API позволяет вам конвертировать ваши PDF-документы в HTML, используя несколько строк кода, и не только это, но также позволяет вам указывать различные параметры форматирования и стиля во время преобразования. В следующем разделе поста вы найдете полное руководство по использованию Aspose.PDF для .NET для преобразования PDF в HTML.
Преобразование PDF в HTML в .NET
Простое преобразование PDF в HTML можно выполнить, загрузив документ PDF и сохранив его как HTML с помощью HtmlSaveOptions. В следующем примере показано не только преобразование, но и спецификация требования, при котором вы можете сохранять изображения в растровом формате:
// Полные примеры и файлы данных см. на странице https://github.com/aspose-pdf/Aspose.PDF-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion_PDFToHTMLFormat();
// Исходный PDF-файл
Document doc = new Document(dataDir + "input.pdf");
// Создайте HtmlSaveOption с проверенной функцией
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.FixedLayout = true;
saveOptions.SplitIntoPages = false;
saveOptions.RasterImagesSavingMode = HtmlSaveOptions.RasterImagesSavingModes.AsExternalPngFilesReferencedViaSvg;
// Сохраните вывод в формате HTML
doc.Save( dataDir + "SaveImages_out.html", saveOptions);
История не заканчивается здесь. Aspose.PDF для .NET предлагает обширные и наиболее требовательные функции, которые не только повышают удобство использования, но и дают вам полный контроль над процессом преобразования по вашему желанию. Вы можете просмотреть следующие выдающиеся и исчерпывающие статьи в документации по API, чтобы понять полный набор функций в этой области, т.е. PDF в HTML:
- PDF в HTML - Разделить CSS на страницы
- PDF в HTML — сохранение шрифтов как WOFF или TTF
- PDF в HTML — укажите префикс для изображения
- PDF в HTML — установка префикса для URL-адресов файлов SVG
- PDF в HTML — установка префикса URL для шрифтов в style.css
- PDF в HTML — префикс имен классов CSS в style.css
- PDF в HTML — добавление префикса к директивам импорта
- PDF в HTML — сохранение вывода в потоковом объекте
- PDF в HTML — сведения о ходе преобразования
- PDF в HTML — избегайте сохранения изображений в формате SVG
- PDF в HTML — единый HTML со всеми встроенными ресурсами
- PDF в HTML — установка размеров выходного файла
- PDF в HTML — исключить ресурсы шрифта
В дополнение к вышеперечисленным функциям Aspose.PDF для .NET 19.8 содержит новое усовершенствование, позволяющее сохранять PDF в HTML с полной шириной содержимого. Давайте посмотрим на использование этой новой функции:
Преобразование PDF в HTML с полной шириной содержимого
Последняя версия API позволяет преобразовывать PDF в HTML с полной шириной содержимого, тогда как содержимое HTML используется для выравнивания по левому краю. Свойство FlowLayoutParagraphFullWidth класса HtmlSaveOptions позволяет добиться этого, как показано в следующем примере кода.
// Полные примеры и файлы данных см. на странице https://github.com/aspose-pdf/Aspose.PDF-for-.NET.
// Путь к каталогу документов.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.FixedLayout = (false);
saveOptions.FlowLayoutParagraphFullWidth = true;
Document doc = new Document(dataDir + "FlowLayoutParagraphFullWidth.Pdf");
doc.Save(dataDir + "FlowLayoutParagraphFullWidth_out.html", saveOptions);
Дальнейшие улучшения и полезные исправления
Фактор удобства использования API становится сильнее благодаря следующему списку полезных улучшений, которые API привносит с собой в [v19.8](https://docs.aspose.com/display/pdfnet/Aspose.PDF+for+.NET+19.8 +Release+Notes “Aspose.PDF for .NET 19.8 Release Notes”):
- Добавление функциональности таблицы дополнительно исправлено
- Подстановка шрифтов улучшена
- Потребление памяти при добавлении HTML в PDF дополнительно импровизировано.
- Преобразование PDF в изображение улучшено
- Преобразование XML в PDF улучшено
- Улучшено преобразование PDF в DOC/DOCX.
- Сценарии добавления и обработки текста были импровизированы.
Мы надеемся, что рассмотрели все аспекты преобразования PDF в HTML в приведенном выше руководстве. Однако, если у вас все еще есть какие-либо вопросы, пожалуйста, сообщите нам об этом. Как всегда, не пропустите одно обновление об API Aspose. Мы скоро вернемся с новой версией API с интересными функциями.