Преобразование Word в Markdown в C#

В настоящее время формат Markdown (MD) широко используется для написания онлайн-статей, блогов и документации. Однако его синтаксис становится трудным для запоминания и написания в случае документов большого размера. Чтобы упростить задачу, вы можете написать контент в MS Word, а затем преобразовать файл DOCX или DOC в Markdown. Чтобы выполнить это преобразование программно, в этой статье рассказывается, как преобразовать документы Word в файлы Markdown (.md) с помощью Java.

Библиотека конвертера Java Word в Markdown

Чтобы преобразовать файлы DOCX/DOC в формат Markdown, мы будем использовать Aspose.Words for Java. Упомянутый API позволяет создавать документы Word и управлять ими из приложений Java. Кроме того, он предоставляет высококачественный конвертер документов для преобразования документов MS Word в другие форматы. Вы можете скачать JAR-файл API или установить его, используя следующие конфигурации Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Преобразование документа Word в Markdown в Java

Ниже приведены шаги для преобразования файла Word DOCX в формат Markdown в Java.

  • Загрузите файл Word, используя класс Document.
  • Преобразуйте файл Word в формат Markdown, используя метод Document.save(string).

В следующем примере кода показано, как преобразовать файл DOCX в формат Markdown с помощью Java.

// Загрузить документ Word с диска
Document doc = new Document("document.docx");

// Сохраните документ в формате Markdown.
doc.save("word-to-markdown.md");

Настроить преобразование Word в Markdown

Вы также можете изменить стандартное поведение API для преобразования Word в Markdown. Например, вы можете установить выравнивание содержимого в таблицах, указать папку для хранения изображений и т.д. Ниже приведены шаги для установки различных параметров преобразования Word в Markdown.

В следующем примере кода показано, как настроить преобразование DOCX в Markdown с помощью Java.

// Загрузить документ Word с диска
Document doc = new Document("document.docx");

// Установите параметры уценки
MarkdownSaveOptions so = new MarkdownSaveOptions();
so.setImagesFolder("D:\\Images");

// Сохраните документ в формате Markdown.
doc.save("word-to-markdown.md", so);

Получите бесплатную лицензию API

Вы можете использовать Aspose.Words for Java без ограничений на пробную версию, используя временную лицензию.

Вывод

В этой статье вы узнали, как программно конвертировать файлы Word DOCX/DOC в Markdown (.md) на Java. Кроме того, вы видели, как изменить преобразование Word в Markdown, используя различные параметры. Вы также можете изучить другие функции, предлагаемые Aspose.Words для Java, используя документацию. Кроме того, вы можете свободно задавать вопросы на нашем форуме.

Смотрите также