Aby osadzić zawartość dokumentów programu Word w swoich aplikacjach, może być konieczne wykonanie konwersji. Najczęściej wybieranymi konwersjami w takich przypadkach są konwersje Word na HTML lub Word na obraz. W związku z tym w tym artykule opisano, jak konwertować pliki Word DOCX lub DOC do formatu HTML przy użyciu języka Java. Omówimy również, jak przechowywać pliki zasobów w osobnym folderze.
- Java API do konwersji Worda na HTML
- Konwertuj dokument programu Word na format HTML
- Określ folder zasobów w programie Word do konwersji HTML
Java API do konwersji Worda na HTML
Do konwersji DOCX/DOC na HTML użyjemy Aspose.Words for Java. Jest to potężny interfejs API do implementacji funkcji przetwarzania tekstu z poziomu aplikacji Java. Ponadto interfejs API zapewnia wysoką wierność konwersji dokumentów programu Word do formatu HTML i innych formatów. Możesz pobrać interfejs API lub zainstalować go z Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.10</version>
<type>pom</type>
</dependency>
Konwertuj dokument programu Word na format HTML w Javie
Aby przekonwertować dokument programu Word na format HTML, wystarczy załadować dokument i zapisać go jako plik HTML. Poniżej przedstawiono kroki konwersji pliku Word DOCX na HTML przy użyciu języka Java.
- Załaduj dokument programu Word, używając klasy Document.
- Konwertuj dokument programu Word do formatu HTML przy użyciu metody Document.save(string, SaveFormat).
Poniższy przykładowy kod pokazuje, jak przekonwertować dokument programu Word na format HTML przy użyciu języka Java.
// Załaduj dokument z dysku
Document doc = new Document("document.docx");
// Zapisz dokument jako HTML
doc.save("Document_out.html", SaveFormat.HTML);
Określ folder zasobów w programie Word do konwersji HTML
Możesz także skonfigurować interfejs API, aby zapisywał pliki zasobów w osobnym folderze. Co więcej, możesz przechowywać czcionki i obrazy oddzielnie w różnych folderach. Poniżej przedstawiono kroki, aby określić folder zasobów.
- Załaduj dokument programu Word, używając klasy Document.
- Utwórz obiekt klasy HtmlSaveOptions.
- Ustaw folder zasobów za pomocą metody HtmlSaveOptions.setResourceFolder.
- Konwertuj dokument programu Word na format HTML przy użyciu metody Document.save(string, HtmlSaveOptions).
Poniższy przykładowy kod przechowuje pliki zasobów w osobnym folderze podczas konwersji programu Word na format HTML.
// Załaduj dokument
Document doc = new Document("Document.docx");
// Określ folder zasobów
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");
// Konwertuj dokument Word na HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);
Możesz czytaj więcej o pracy z folderami zasobów w konwersji Worda na HTML.
Uzyskaj bezpłatną licencję API
Możesz używać Aspose.Words for Java bez ograniczeń ewaluacyjnych, otrzymując bezpłatną tymczasową licencję.
Wniosek
W tym artykule nauczyłeś się programowo konwertować pliki Word DOCX lub DOC do formatu HTML przy użyciu języka Java. Oprócz tego widziałeś, jak oddzielnie przechowywać pliki zasobów w konwersji Word na HTML. Poza tym możesz przeczytać więcej o Aspose.Words for Java korzystając z dokumentacji. Ponadto możesz podzielić się z nami swoimi pytaniami na naszym forum.