В одной из предыдущих статей мы говорили о том, как преобразовать файлы PDF в презентации PowerPoint PPT/PPTX с помощью C# в наших приложениях .NET. В большинстве случаев базовый набор параметров преобразования работает хорошо. Однако сегодня мы обсудим некоторые продвинутые приемы преобразования PDF в PPTX:
Обработка примечаний или комментариев в преобразовании PDF в PPTX C#
Когда я рассказываю людям о чем-то и использую презентацию, я также люблю делать пометки на слайдах, рисовать стрелки, делать акценты геометрическими фигурами и т. д.
Как рисовать в PDF?
Это легко: я открываю PDF-файл в Adobe Reader DC или в Microsoft Edge и использую карандаш. По умолчанию Adobe Reader использует красный карандаш.
Принимая во внимание, что Microsoft Edge использует синий.
Если такие файлы PDF преобразовать в презентацию PPTX, то все примечания переносятся в файл PPTX.
Как мы можем это исправить?
С точки зрения стандарта PDF мы имеем дело с содержимым страниц и дополнительными элементами, называемыми аннотациями. Давайте напишем небольшой фрагмент кода на C#, чтобы выяснить, какие типы аннотаций присутствуют в таких документах.
После выполнения мы получим примерно такой результат:
1 Andrew Ink #E52237
1 Andrew Popup #000000
1 Andrew Square #E52237
1 Andrew Popup #000000
Это означает, что на странице PDF есть три типа аннотаций:
- Чернила – это наш карандашный рисунок,
- Квадрат – наш рисунок прямоугольника,
- Popup – всплывающая аннотация отображает текст во всплывающем окне для ввода и редактирования. Он не должен отображаться один, но связан с аннотацией разметки, его родительской аннотацией и должен использоваться для редактирования родительского текста. В нашем случае аннотация Popup связана с Ink и Square. У него не должно быть внешнего потока, поэтому он не повлияет на преобразование PDF в PPTX.
Удалить аннотации при преобразовании PDF в PPTX
Итак, чтобы удалить лишние рисунки в PDF, мы должны удалить аннотации Ink и Square. Ниже приведены шаги для выполнения этой операции.
- Получите доступ к аннотациям с помощью свойства Page.Annotations.
- Отфильтруйте аннотации по типу.
- Прокрутите аннотации и удалите их одну за другой, используя метод Page.Annotations.Delete(Annotation).
Фрагмент кода C# ниже показывает один из возможных способов удаления аннотаций при преобразовании PDF в PPTX:
Как упоминалось выше, ведущий может использовать разные инструменты и цвета для комментариев, а мы можем (при необходимости) настроить последний образец. Например, мы можем удалить только красные (цветовой код #E52237) аннотации или аннотации некоторых докладчиков.
Давайте попробуем еще один способ улучшить графический контент при преобразовании PDF в PPTX.
С# PDF в PPTX — отделить графику оформления от изображений содержимого
При преобразовании PDF в PPTX обычно все изображения в файле PDF группируются в одно фоновое изображение на выходе. Это не всегда удобно, и в Aspose.PDF для .NET есть специальный режим, который может изменить поведение конвертера при преобразовании PDF в PPTX.
Чтобы включить этот режим, вы можете установить для свойства SeparateImages значение true. В следующем фрагменте кода показано, как использовать этот параметр при преобразовании PDF в PPTX на C#:
Таким образом, слайд из предыдущего примера будет разбит на 3 изображения.
Следует отметить, что не всегда возможно точно отделить фоновые изображения от изображений содержимого. Поэтому конвертер иногда может ошибаться и добавлять в контент лишние элементы.
Вывод
В этой статье вы узнали, как работать с комментариями и декоративной графикой при преобразовании PDF в PPTX C#. Вы можете оценить качество работы нашего конвертера PDF в PPTX с помощью полнофункционального бесплатного веб-приложения - Aspose.PDF PPTX Converter.