
В настоящее время формат Markdown (MD) широко используется для написания онлайн-статей, блогов и документации. Однако его синтаксис становится трудным для запоминания и написания в случае документов большого размера. Чтобы упростить задачу, вы можете написать контент в MS Word, а затем преобразовать файл DOCX или DOC в Markdown. Чтобы выполнить это преобразование программно, в этой статье рассказывается, как преобразовать документы Word в файлы Markdown (.md) с помощью Java.
- Библиотека конвертера Word в Markdown
- Преобразование документа Word в Markdown
- Настроить преобразование Word в Markdown
Библиотека конвертера Java Word в Markdown
Чтобы преобразовать файлы DOCX/DOC в формат Markdown, мы будем использовать Aspose.Words for Java. Упомянутый API позволяет создавать документы Word и управлять ими из приложений Java. Кроме того, он предоставляет высококачественный конвертер документов для преобразования документов MS Word в другие форматы. Вы можете скачать JAR-файл API или установить его, используя следующие конфигурации Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Преобразование документа Word в Markdown в Java
Ниже приведены шаги для преобразования файла Word DOCX в формат Markdown в Java.
- Загрузите файл Word, используя класс Document.
- Преобразуйте файл Word в формат Markdown, используя метод Document.save(string).
В следующем примере кода показано, как преобразовать файл DOCX в формат Markdown с помощью Java.
// Загрузить документ Word с диска
Document doc = new Document("document.docx");
// Сохраните документ в формате Markdown.
doc.save("word-to-markdown.md");
Настроить преобразование Word в Markdown
Вы также можете изменить стандартное поведение API для преобразования Word в Markdown. Например, вы можете установить выравнивание содержимого в таблицах, указать папку для хранения изображений и т.д. Ниже приведены шаги для установки различных параметров преобразования Word в Markdown.
- Загрузите документ Word, используя класс Document.
- Создайте объект класса MarkdownSaveOptions.
- Установите нужные параметры, например MarkdownSaveOptions.setImagesFolder(string).
- Преобразуйте документ Word в Markdown, используя метод Document.save(string, MarkdownSaveOptions).
В следующем примере кода показано, как настроить преобразование DOCX в Markdown с помощью Java.
// Загрузить документ Word с диска
Document doc = new Document("document.docx");
// Установите параметры уценки
MarkdownSaveOptions so = new MarkdownSaveOptions();
so.setImagesFolder("D:\\Images");
// Сохраните документ в формате Markdown.
doc.save("word-to-markdown.md", so);
Получите бесплатную лицензию API
Вы можете использовать Aspose.Words for Java без ограничений на пробную версию, используя временную лицензию.
Вывод
В этой статье вы узнали, как программно конвертировать файлы Word DOCX/DOC в Markdown (.md) на Java. Кроме того, вы видели, как изменить преобразование Word в Markdown, используя различные параметры. Вы также можете изучить другие функции, предлагаемые Aspose.Words для Java, используя документацию. Кроме того, вы можете свободно задавать вопросы на нашем форуме.