Word to HTML Java

Щоб вставити вміст документів Word у ваші програми, вам може знадобитися виконати перетворення. Найпоширенішим варіантом перетворення в таких випадках є Word у HTML або зображення. Після цього в цій статті описано, як конвертувати файли Word DOCX або DOC у HTML за допомогою Java. Крім того, ми обговоримо, як зберігати файли ресурсів в окремій папці.

Java API для перетворення Word у HTML

Для перетворення DOCX DOC у HTML ми будемо використовувати Aspose.Words for Java. Він надає безкоштовне, високоякісне та високошвидкісне рішення для перетворення Word у HTML. Ви можете конвертувати скільки завгодно документів Word у HTML. Ви можете завантажити API або встановити його з Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>22.10</version>
    <type>pom</type>
</dependency>

Перетворіть документ Word на HTML у Java

Щоб конвертувати документ Word у HTML, вам потрібно лише завантажити документ і зберегти його як файл HTML. Нижче наведено кроки для перетворення файлу Word DOCX у HTML за допомогою Java.

  • Завантажте документ Word за допомогою класу Document.
  • Перетворіть документ Word на HTML за допомогою методу Document.save(string, SaveFormat).

У наведеному нижче прикладі коду показано, як конвертувати документ Word у HTML за допомогою Java.

// Завантажте документ з диска
Document doc = new Document("document.docx");

// Збережіть документ як HTML
doc.save("Document_out.html", SaveFormat.HTML);

Укажіть папку ресурсів у Word для перетворення HTML

Ви також можете налаштувати API для збереження файлів ресурсів в окремій папці. Крім того, ви можете зберігати шрифти та зображення окремо в різних папках. Нижче наведено кроки для визначення папки ресурсу.

Наведений нижче зразок коду зберігає файли ресурсів в окремій папці в Word для перетворення HTML.

// Завантажити документ
Document doc = new Document("Document.docx");

// Вкажіть папку ресурсу
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");

// Перетворення документа Word на HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);

Ви можете докладніше про роботу з папками ресурсів у Word для перетворення HTML.

Безкоштовний конвертер Word в HTML

Ви можете отримати безкоштовну тимчасову ліцензію і конвертувати документи Word у HTML без будь-яких обмежень.

Висновок

У цій статті ви дізналися, як програмно конвертувати файли Word DOCX або DOC у HTML за допомогою Java. На додаток до цього ви бачили, як зберігати файли ресурсів окремо під час перетворення Word у HTML. Крім того, ви можете прочитати більше про Aspose.Words for Java, використовуючи документацію. Крім того, ви можете поділитися своїми запитами з нами на нашому форумі.

Дивись також