Konwersja Word do HTML jest wymagana w różnych przypadkach, np. do osadzania treści dokumentu na stronach internetowych. W tym artykule dowiesz się, jak konwertować dokumenty MS Word DOCX lub DOC do formatu HTML za pomocą Python. Ponadto dowiesz się, jak dynamicznie kontrolować konwersję Worda do HTML za pomocą różnych opcji.
- Interfejs API konwertera Worda na HTML w języku Python
- Konwertuj dokument programu Word na format HTML
- Dostosuj konwersję Worda do HTML
Interfejs API konwertera Worda na HTML w języku Python
Do konwersji dokumentów Worda do formatu HTML użyjemy Aspose.Words for Python. Jest to potężny i bogaty w funkcje interfejs API do tworzenia i manipulowania dokumentami programu Word. Zapewnia również wysoką wierność konwersji dokumentów programu Word do innych formatów. Aspose.Words for Python jest dostępny na PyPI i możesz go zainstalować za pomocą następującego polecenia pip.
pip install aspose-words
Konwertuj dokument programu Word na format HTML w Python
Poniżej przedstawiono kroki konwersji dokumentu programu Word do pliku HTML przy użyciu języka Python.
- Załaduj dokument programu Word przy użyciu klasy Document.
- Utwórz obiekt klasy HtmlSaveOptions.
- Włącz eksport zasobów czcionek przy użyciu właściwości HtmlSaveOptions.exportfontresources.
- Konwertuj dokument programu Word na format HTML za pomocą metody Document.save().
Poniższy przykładowy kod pokazuje, jak przekonwertować plik DOCX na format HTML w języku Python.
import aspose.words as aw
# Załaduj dokument z dysku
doc = aw.Document("Document.docx")
# Włącz eksport czcionek
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
# Zapisz dokument jako HTML
doc.save("Document.html", options)
Dostosuj konwersję Worda do HTML w Python
Aspose.Words for Python zapewnia również różne opcje dostosowywania konwersji Worda do HTML. Na przykład można konwertować dokumenty z informacjami o obiegu w obie strony, określić folder do zapisania plików zasobów i tak dalej.
Konwertuj dokument programu Word z informacjami w obie strony
HTML nie obsługuje wszystkich funkcji zapewnianych przez MS Word, dlatego aby naśladować dokument Worda w HTML, musimy zapisać dodatkowe informacje określane jako informacje w obie strony. Poniżej przedstawiono kroki umożliwiające włączenie eksportu informacji w obie strony w przypadku konwersji programu Word na format HTML.
- Załaduj dokument programu Word przy użyciu klasy Document.
- Utwórz obiekt klasy HtmlSaveOptions i ustaw właściwość HtmlSaveOptions.exportroundtripinformation na true.
- Konwertuj dokument Worda na HTML za pomocą metody Document.save() i przekaż nazwę pliku HTML oraz HtmlSaveOptions jako parametry.
Poniższy przykładowy kod pokazuje, jak wyeksportować informacje w obie strony w konwersji programu Word na format HTML.
import aspose.words as aw
# Załaduj dokument z dysku
doc = aw.Document("Document.docx")
# Włącz informacje w obie strony
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True
# Zapisz dokument jako HTML
doc.save("Document.html", saveOptions)
Word do HTML: Określ folder dla zasobów
Możesz także określić folder, w którym chcesz przechowywać wszystkie zasoby, takie jak obrazy, pliki CSS i czcionki. W tym celu możesz użyć właściwości HtmlSaveOptions.exportfontresources. Można również określić osobne foldery dla czcionek i obrazów, używając odpowiednio właściwości HtmlSaveOptions.fontsfolder i HtmlSaveOptions.imagesfolder. Poniżej przedstawiono kroki, aby użyć oddzielnego folderu do zapisywania zasobów podczas konwersji programu Word na HTML.
- Załaduj dokument programu Word przy użyciu klasy Document.
- Utwórz obiekt klasy HtmlSaveOptions i ustaw właściwość HtmlSaveOptions.exportfontresources na true.
- Określ nazwę folderu zasobów przy użyciu właściwości HtmlSaveOptions.resourcefolder.
- Konwertuj dokument Worda na HTML za pomocą metody Document.save() i przekaż nazwę pliku HTML oraz HtmlSaveOptions jako parametry.
Poniższy przykładowy kod pokazuje, jak określić folder zasobów w konwersji Word na HTML.
import aspose.words as aw
# Załaduj dokument z dysku
doc = aw.Document("Document.docx")
# Określ folder zasobów
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"
# Zapisz dokument jako HTML
doc.save("Document.html", saveOptions)
Uzyskaj bezpłatną licencję API
Możesz uzyskać tymczasową licencję, aby używać Aspose.Words for Python bez ograniczeń ewaluacyjnych.
Wniosek
W tym artykule nauczyłeś się, jak konwertować dokumenty Worda do formatu HTML przy użyciu Python. Co więcej, widziałeś, jak dynamicznie dostosowywać konwersję Worda do HTML. Poza tym możesz poznać inne funkcje Aspose.Words for Python korzystając z dokumentacji. Możesz także zadawać pytania za pośrednictwem naszego forum.
Zobacz też
Info: Być może zainteresuje Cię inne API Python (Aspose.Slides for Python via NET), które umożliwia konwertowanie prezentacji na obrazy i importowanie obrazów do prezentacji.