워드에서 HTML 파이썬으로

Word에서 HTML로의 변환은 웹 페이지에 문서의 내용을 포함하는 것과 같은 다양한 경우에 필요합니다. 이 기사에서는 Python을 사용하여 MS Word DOCX 또는 DOC 문서를 HTML로 변환하는 방법을 배웁니다. 또한 다양한 옵션을 사용하여 Word에서 HTML로의 변환을 동적으로 제어하는 방법을 배우게 됩니다.

HTML 변환기 API에 파이썬 워드

Word 문서를 HTML로 변환하기 위해 Aspose.Words for Python을 사용합니다. Word 문서를 만들고 조작하기 위한 강력하고 기능이 풍부한 API입니다. 또한 Word 문서를 다른 형식으로 고화질로 변환합니다. Aspose.Words for Python은 PyPI에서 사용할 수 있으며 다음 pip 명령을 사용하여 설치할 수 있습니다.

pip install aspose-words 

Python에서 Word 문서를 HTML로 변환

다음은 Python을 사용하여 Word 문서를 HTML 파일로 변환하는 단계입니다.

  • Document 클래스를 사용하여 Word 문서를 로드합니다.
  • HtmlSaveOptions 클래스의 개체를 만듭니다.
  • HtmlSaveOptions.export\font\resources 속성을 사용하여 글꼴 리소스 내보내기를 활성화합니다.
  • Document.save() 메서드를 사용하여 Word 문서를 HTML로 변환합니다.

다음 코드 샘플은 Python에서 DOCX 파일을 HTML로 변환하는 방법을 보여줍니다.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Enable export of fonts
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
  
# Save the document as HTML
doc.save("Document.html", options)

Python에서 Word에서 HTML로의 변환 사용자 지정

Aspose.Words for Python은 Word에서 HTML로의 변환을 사용자 지정하기 위한 다양한 옵션도 제공합니다. 예를 들어 왕복 정보가 있는 문서를 변환하고 리소스 파일을 저장할 폴더를 지정하는 등의 작업을 수행할 수 있습니다.

왕복 정보가 있는 Word 문서 변환

HTML은 MS Word에서 제공하는 모든 기능을 지원하지 않으므로 HTML에서 Word 문서를 모방하려면 왕복 정보라는 추가 정보를 저장해야 합니다. 다음은 Word에서 HTML로의 왕복 정보 내보내기를 설정하는 단계입니다.

  • Document 클래스를 사용하여 Word 문서를 로드합니다.
  • HtmlSaveOptions 클래스의 개체를 만들고 HtmlSaveOptions.export\roundtrip\information 속성을 true로 설정합니다.
  • Document.save() 메서드를 사용하여 Word 문서를 HTML로 변환하고 HTML 파일의 이름과 HtmlSaveOptions를 매개변수로 전달합니다.

다음 코드 샘플은 Word에서 HTML로의 왕복 정보를 내보내는 방법을 보여줍니다.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Enable round-trip information
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True 

# Save the document as HTML
doc.save("Document.html", saveOptions)

Word에서 HTML로: 리소스 폴더 지정

이미지, CSS 파일 및 글꼴과 같은 모든 리소스를 저장할 폴더를 지정할 수도 있습니다. 이를 위해 HtmlSaveOptions.export\font\resources 속성을 사용할 수 있습니다. HtmlSaveOptions.fonts\folder 및 HtmlSaveOptions.images\folder 속성을 각각 사용하여 글꼴과 이미지에 대해 별도의 폴더를 지정할 수도 있습니다. 다음은 별도의 폴더를 사용하여 Word에서 HTML로 변환하는 리소스를 저장하는 단계입니다.

  • Document 클래스를 사용하여 Word 문서를 로드합니다.
  • HtmlSaveOptions 클래스의 개체를 만들고 HtmlSaveOptions.export\font\resources 속성을 true로 설정합니다.
  • HtmlSaveOptions.resource\folder 속성을 사용하여 리소스 폴더의 이름을 지정합니다.
  • Document.save() 메서드를 사용하여 Word 문서를 HTML로 변환하고 HTML 파일의 이름과 HtmlSaveOptions를 매개변수로 전달합니다.

다음 코드 샘플은 Word에서 HTML로 변환하는 리소스 폴더를 지정하는 방법을 보여줍니다.

import aspose.words as aw

# Load the document from disk
doc = aw.Document("Document.docx")

# Specify resource folder
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"

# Save the document as HTML
doc.save("Document.html", saveOptions)

무료 API 라이선스 받기

평가 제한 없이 Aspose.Words for Python을 사용하려면 임시 라이선스를 취득할 수 있습니다.

결론

이 기사에서는 Python을 사용하여 Word 문서를 HTML로 변환하는 방법을 배웠습니다. 또한 Word에서 HTML로의 변환을 동적으로 사용자 지정하는 방법을 살펴보았습니다. 게다가 문서를 사용하여 Python용 Aspose.Words의 다른 기능을 탐색할 수 있습니다. 또한 포럼을 통해 질문할 수 있습니다.

또한보십시오

정보: 프리젠테이션을 이미지로 변환이미지를 프리젠테이션으로 가져오기할 수 있는 다른 Python API(Aspose.Slides for Python via NET)에 관심이 있을 수 있습니다.