Преобразование документов Word в EPUB на Java

Большинство интеллектуальных устройств, таких как смартфоны, планшеты, ноутбуки и т. д., поддерживают формат EPUB для просмотра или чтения документов. Это широко используемый формат для электронных книг или электронных публикаций. С другой стороны, форматы MS Word, такие как DOCX, DOC и т. д., относятся к числу широко используемых форматов документов в цифровом мире. В этой статье мы покажем вам, как программно конвертировать файлы MS Word в EPUB с помощью Java. Кроме того, вы узнаете, как настроить преобразование Word в EPUB, используя различные параметры.

Java API для преобразования Word в EPUB

Чтобы преобразовать файлы DOCX, DOC и т. д. в формат EPUB, мы будем использовать Aspose.Words for Java. Указанный API позволяет беспрепятственно создавать документы MS Word и управлять ими. Кроме того, вы можете выполнять высокоточное преобразование файлов Word в другие форматы, такие как EPUB, HTML, PDF и т. д. Вы можете загрузить JAR-файл API или установить его в свои приложения на основе Maven, используя следующие конфигурации. .

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Преобразование документа Word в EPUB на Java

Ниже приведены шаги для преобразования файла Word DOCX в EPUB на Java.

  • Загрузите файл Word, используя класс Document.
  • Преобразуйте файл в формат EPUB, используя метод Document.save(string).

В следующем примере кода показано, как преобразовать файл DOCX в EPUB в Java.

// Загрузите документ Word
Document doc = new Document("document.docx");

// Конвертировать документ Word в EPUB
doc.save("word-to-epub.epub");

Настройте преобразование Word в EPUB в Java

Вы также можете изменить поведение API по умолчанию для преобразования Word в EPUB, используя различные параметры. Например, вы можете указать схему кодирования, экспортировать информацию о документе, установить критерии разделения и т. д. Ниже приведены шаги по настройке преобразования Word в EPUB.

  • Загрузите файл Word, используя класс Document.
  • Создайте объект класса HtmlSaveOptions и задайте необходимые параметры.
  • Преобразуйте файл в EPUB, используя метод Document.save(string, HtmlSaveOptions).

В следующем примере кода показано, как настроить преобразование Word в EPUB.

// Загрузите документ Word
Document doc = new Document("document.docx");

// Создать объект для параметров сохранения
HtmlSaveOptions saveOptions = new HtmlSaveOptions();

// Установите желаемую кодировку
saveOptions.setEncoding(Charset.forName("UTF-8"));

// Укажите, на каких элементах следует разделить внутренний HTML. Это создает новый HTML в EPUB. 
// что позволяет ограничить размер каждой части HTML. Это полезно для читателей, которые не умеют читать 
// HTML-файлы больше определенного размера, например 300 КБ.
saveOptions.setDocumentSplitCriteria(DocumentSplitCriteria.HEADING_PARAGRAPH);

// Включить экспорт свойств документа
saveOptions.setExportDocumentProperties(true);

// Укажите формат сохранения
saveOptions.setSaveFormat(SaveFormat.EPUB);

// Конвертировать документ Word в EPUB
doc.save("word-to-epub.epub", saveOptions);

Получить бесплатную лицензию

Вы можете использовать Aspose.Words for Java без ограничений по ознакомительной версии, получив бесплатную временную лицензию.

Вывод

В этой статье вы узнали, как конвертировать документы Word в формат EPUB на Java. Кроме того, вы видели, как изменить преобразование Word в EPUB, используя различные параметры. Кроме того, вы можете посетить документацию, чтобы узнать, что еще предлагает Aspose.Words for Java. Если у вас возникнут какие-либо затруднения или вопросы, вы можете сообщить нам об этом через наш форум.

Смотрите также