Word zu HTML-Java

Um den Inhalt von Word Dokumenten in Ihre Anwendungen einzubetten, müssen Sie möglicherweise die Konvertierung durchführen. Die am häufigsten gewählten Konvertierungen in solchen Fällen sind Word in HTML oder Word in Bild. Dementsprechend behandelt dieser Artikel, wie man Word DOCX oder DOC Dateien mit Java in HTML konvertiert. Außerdem besprechen wir, wie Ressourcendateien in einem separaten Ordner aufbewahrt werden.

Java API für die Word zu HTML-Konvertierung

Für die Umwandlung von DOCX/DOC in HTML verwenden wir Aspose.Words for Java. Es ist eine leistungsstarke API zur Implementierung von Textverarbeitungsfunktionen aus Java Anwendungen heraus. Darüber hinaus bietet die API eine High-Fidelity-Konvertierung von Word Dokumenten in HTML und andere Formate. Sie können die API entweder herunterladen oder von Maven installieren.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.10</version>
    <type>pom</type>
</dependency>

Konvertieren Sie ein Word Dokument in Java in HTML

Um ein Word Dokument in HTML zu konvertieren, müssen Sie das Dokument nur laden und als HTML Datei speichern. Im Folgenden sind die Schritte zum Konvertieren einer Word DOCX Datei in HTML mit Java aufgeführt.

Das folgende Codebeispiel zeigt, wie Sie ein Word Dokument mit Java in HTML konvertieren.

// Laden Sie das Dokument von der Festplatte
Document doc = new Document("document.docx");

// Speichern Sie das Dokument als HTML
doc.save("Document_out.html", SaveFormat.HTML);

Geben Sie den Ressourcenordner in der Word zu HTML-Konvertierung an

Sie können die API auch so konfigurieren, dass die Ressourcendateien in einem separaten Ordner gespeichert werden. Darüber hinaus können Sie Schriftarten und Bilder getrennt in verschiedenen Ordnern aufbewahren. Im Folgenden sind die Schritte zum Angeben des Ressourcenordners aufgeführt.

Das folgende Codebeispiel speichert Ressourcendateien in einem separaten Ordner bei der Word zu HTML-Konvertierung.

// Dokument laden
Document doc = new Document("Document.docx");

// Geben Sie den Ressourcenordner an
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");

// Konvertieren Sie Word Dokumente in HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);

Sie können weiterlesen über das Arbeiten mit Ressourcenordnern bei der Word zu HTML-Konvertierung erfahren.

Holen Sie sich eine kostenlose API Lizenz

Sie können Aspose.Words for Java ohne Evaluierungseinschränkungen verwenden, indem Sie eine kostenlose temporäre Lizenz erwerben.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie Word DOCX oder DOC Dateien programmgesteuert mit Java in HTML konvertieren. Darüber hinaus haben Sie gesehen, wie Sie Ressourcendateien bei der Word zu HTML-Konvertierung separat speichern können. Außerdem können Sie in der Dokumentation mehr über Aspose.Words for Java lesen. Darüber hinaus können Sie uns Ihre Fragen in unserem Forum mitteilen.

Siehe auch