Щоб вставити вміст документів Word у ваші програми, вам може знадобитися виконати перетворення. Найпоширенішим варіантом перетворення в таких випадках є Word у HTML або зображення. Після цього в цій статті описано, як конвертувати файли Word DOCX або DOC у HTML за допомогою Java. Крім того, ми обговоримо, як зберігати файли ресурсів в окремій папці.
- Java API для перетворення Word у HTML
- Перетворення документа Word на HTML
- Укажіть папку ресурсів у Word для перетворення HTML
Java API для перетворення Word у HTML
Для перетворення DOCX DOC у HTML ми будемо використовувати Aspose.Words for Java. Він надає безкоштовне, високоякісне та високошвидкісне рішення для перетворення Word у HTML. Ви можете конвертувати скільки завгодно документів Word у HTML. Ви можете завантажити API або встановити його з Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>22.10</version>
<type>pom</type>
</dependency>
Перетворіть документ Word на HTML у Java
Щоб конвертувати документ Word у HTML, вам потрібно лише завантажити документ і зберегти його як файл HTML. Нижче наведено кроки для перетворення файлу Word DOCX у HTML за допомогою Java.
- Завантажте документ Word за допомогою класу Document.
- Перетворіть документ Word на HTML за допомогою методу Document.save(string, SaveFormat).
У наведеному нижче прикладі коду показано, як конвертувати документ Word у HTML за допомогою Java.
// Завантажте документ з диска
Document doc = new Document("document.docx");
// Збережіть документ як HTML
doc.save("Document_out.html", SaveFormat.HTML);
Укажіть папку ресурсів у Word для перетворення HTML
Ви також можете налаштувати API для збереження файлів ресурсів в окремій папці. Крім того, ви можете зберігати шрифти та зображення окремо в різних папках. Нижче наведено кроки для визначення папки ресурсу.
- Завантажте документ Word за допомогою класу Document.
- Створіть об’єкт класу HtmlSaveOptions.
- Встановіть папку ресурсів за допомогою методу HtmlSaveOptions.setResourceFolder.
- Перетворіть документ Word на HTML за допомогою методу Document.save(string, HtmlSaveOptions).
Наведений нижче зразок коду зберігає файли ресурсів в окремій папці в Word для перетворення HTML.
// Завантажити документ
Document doc = new Document("Document.docx");
// Вкажіть папку ресурсу
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");
// Перетворення документа Word на HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);
Ви можете докладніше про роботу з папками ресурсів у Word для перетворення HTML.
Безкоштовний конвертер Word в HTML
Ви можете отримати безкоштовну тимчасову ліцензію і конвертувати документи Word у HTML без будь-яких обмежень.
Висновок
У цій статті ви дізналися, як програмно конвертувати файли Word DOCX або DOC у HTML за допомогою Java. На додаток до цього ви бачили, як зберігати файли ресурсів окремо під час перетворення Word у HTML. Крім того, ви можете прочитати більше про Aspose.Words for Java, використовуючи документацію. Крім того, ви можете поділитися своїми запитами з нами на нашому форумі.