В одной из предыдущих статей мы говорили о том, как преобразовать файлы PDF в презентации PowerPoint PPT/PPTX с помощью C# в наших приложениях .NET. В большинстве случаев базовый набор параметров преобразования работает хорошо. Однако сегодня мы обсудим некоторые продвинутые приемы преобразования PDF в PPTX:

Обработка примечаний или комментариев в преобразовании PDF в PPTX C#

Когда я рассказываю людям о чем-то и использую презентацию, я также люблю делать пометки на слайдах, рисовать стрелки, делать акценты геометрическими фигурами и т. д.

Как рисовать в PDF?

Это легко: я открываю PDF-файл в Adobe Reader DC или в Microsoft Edge и использую карандаш. По умолчанию Adobe Reader использует красный карандаш.

обрабатывать заметки из pdf в pptx

Создание заметок в Adobe Reader

Принимая во внимание, что Microsoft Edge использует синий.

pdf в pptx комментарии и заметки

Если такие файлы PDF преобразовать в презентацию PPTX, то все примечания переносятся в файл PPTX.

Как мы можем это исправить?

С точки зрения стандарта PDF мы имеем дело с содержимым страниц и дополнительными элементами, называемыми аннотациями. Давайте напишем небольшой фрагмент кода на C#, чтобы выяснить, какие типы аннотаций присутствуют в таких документах.

После выполнения мы получим примерно такой результат:

1 Andrew Ink #E52237
1 Andrew Popup #000000
1 Andrew Square #E52237
1 Andrew Popup #000000

Это означает, что на странице PDF есть три типа аннотаций:

  • Чернила – это наш карандашный рисунок,
  • Квадрат – наш рисунок прямоугольника,
  • Popup – всплывающая аннотация отображает текст во всплывающем окне для ввода и редактирования. Он не должен отображаться один, но связан с аннотацией разметки, его родительской аннотацией и должен использоваться для редактирования родительского текста. В нашем случае аннотация Popup связана с Ink и Square. У него не должно быть внешнего потока, поэтому он не повлияет на преобразование PDF в PPTX.

Удалить аннотации при преобразовании PDF в PPTX

Итак, чтобы удалить лишние рисунки в PDF, мы должны удалить аннотации Ink и Square. Ниже приведены шаги для выполнения этой операции.

  • Получите доступ к аннотациям с помощью свойства Page.Annotations.
  • Отфильтруйте аннотации по типу.
  • Прокрутите аннотации и удалите их одну за другой, используя метод Page.Annotations.Delete(Annotation).

Фрагмент кода C# ниже показывает один из возможных способов удаления аннотаций при преобразовании PDF в PPTX:

Как упоминалось выше, ведущий может использовать разные инструменты и цвета для комментариев, а мы можем (при необходимости) настроить последний образец. Например, мы можем удалить только красные (цветовой код #E52237) аннотации или аннотации некоторых докладчиков.

Давайте попробуем еще один способ улучшить графический контент при преобразовании PDF в PPTX.

С# PDF в PPTX — отделить графику оформления от изображений содержимого

При преобразовании PDF в PPTX обычно все изображения в файле PDF группируются в одно фоновое изображение на выходе. Это не всегда удобно, и в Aspose.PDF для .NET есть специальный режим, который может изменить поведение конвертера при преобразовании PDF в PPTX.

Чтобы включить этот режим, вы можете установить для свойства SeparateImages значение true. В следующем фрагменте кода показано, как использовать этот параметр при преобразовании PDF в PPTX на C#:

Таким образом, слайд из предыдущего примера будет разбит на 3 изображения.

изображения украшений в формате pdf в pptx

Следует отметить, что не всегда возможно точно отделить фоновые изображения от изображений содержимого. Поэтому конвертер иногда может ошибаться и добавлять в контент лишние элементы.

Вывод

В этой статье вы узнали, как работать с комментариями и декоративной графикой при преобразовании PDF в PPTX C#. Вы можете оценить качество работы нашего конвертера PDF в PPTX с помощью полнофункционального бесплатного веб-приложения - Aspose.PDF PPTX Converter.

Смотрите также