Słowo do HTML Java

Aby osadzić zawartość dokumentów programu Word w swoich aplikacjach, może być konieczne wykonanie konwersji. Najczęściej wybieranymi konwersjami w takich przypadkach są konwersje Word na HTML lub Word na obraz. W związku z tym w tym artykule opisano, jak konwertować pliki Word DOCX lub DOC do formatu HTML przy użyciu języka Java. Omówimy również, jak przechowywać pliki zasobów w osobnym folderze.

Java API do konwersji Worda na HTML

Do konwersji DOCX/DOC na HTML użyjemy Aspose.Words for Java. Jest to potężny interfejs API do implementacji funkcji przetwarzania tekstu z poziomu aplikacji Java. Ponadto interfejs API zapewnia wysoką wierność konwersji dokumentów programu Word do formatu HTML i innych formatów. Możesz pobrać interfejs API lub zainstalować go z Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.10</version>
    <type>pom</type>
</dependency>

Konwertuj dokument programu Word na format HTML w Javie

Aby przekonwertować dokument programu Word na format HTML, wystarczy załadować dokument i zapisać go jako plik HTML. Poniżej przedstawiono kroki konwersji pliku Word DOCX na HTML przy użyciu języka Java.

Poniższy przykładowy kod pokazuje, jak przekonwertować dokument programu Word na format HTML przy użyciu języka Java.

// Załaduj dokument z dysku
Document doc = new Document("document.docx");

// Zapisz dokument jako HTML
doc.save("Document_out.html", SaveFormat.HTML);

Określ folder zasobów w programie Word do konwersji HTML

Możesz także skonfigurować interfejs API, aby zapisywał pliki zasobów w osobnym folderze. Co więcej, możesz przechowywać czcionki i obrazy oddzielnie w różnych folderach. Poniżej przedstawiono kroki, aby określić folder zasobów.

Poniższy przykładowy kod przechowuje pliki zasobów w osobnym folderze podczas konwersji programu Word na format HTML.

// Załaduj dokument
Document doc = new Document("Document.docx");

// Określ folder zasobów
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");

// Konwertuj dokument Word na HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);

Możesz czytaj więcej o pracy z folderami zasobów w konwersji Worda na HTML.

Uzyskaj bezpłatną licencję API

Możesz używać Aspose.Words for Java bez ograniczeń ewaluacyjnych, otrzymując bezpłatną tymczasową licencję.

Wniosek

W tym artykule nauczyłeś się programowo konwertować pliki Word DOCX lub DOC do formatu HTML przy użyciu języka Java. Oprócz tego widziałeś, jak oddzielnie przechowywać pliki zasobów w konwersji Word na HTML. Poza tym możesz przeczytać więcej o Aspose.Words for Java korzystając z dokumentacji. Ponadto możesz podzielić się z nami swoimi pytaniami na naszym forum.

Zobacz też