Python에서 DOCX를 TXT로 변환

MS Word DOCDOCX 형식은 서식 있는 텍스트 문서를 만드는 데 일반적으로 사용됩니다. DOC/DOCX 문서에 텍스트, 표, 그래픽, 애니메이션 및 기타 다양한 요소를 추가할 수 있습니다. 그러나 Word 문서의 텍스트를 구문 분석하고 분석하는 것과 같은 특정 경우에는 DOC/DOCX 파일을 프로그래밍 방식으로 TXT 형식으로 변환해야 합니다. 이를 달성하기 위해 이 기사에서는 Python에서 DOC 또는 DOCX 파일을 TXT 형식으로 변환하는 방법을 다룹니다.

Python DOC/DOCX-TXT 변환기 라이브러리

DOC 및 DOCX 파일을 TXT 형식으로 저장하려면 Aspose.Words for Python을 사용합니다. 텍스트 문서를 매끄럽게 만들고 조작할 수 있는 다양한 기능을 제공하는 강력하고 빠른 라이브러리입니다. 또한 문서를 다른 형식으로 고품질 변환할 수 있습니다. 다음 pip 명령을 사용하여 PyPI에서 Python 애플리케이션에 라이브러리를 설치할 수 있습니다.

> pip install aspose-words

Python에서 DOCX를 TXT로 변환

Python에서 DOCX 파일을 TXT로 변환하는 방법을 살펴보겠습니다. 이를 위해서는 DOCX 파일을 불러와서 TXT 파일로 저장하기만 하면 됩니다. 다음은 Python에서 DOCX 파일을 TXT 형식으로 저장하는 단계입니다.

  • Document 클래스를 사용하여 DOCX 파일을 로드합니다.
  • Document.save() 메서드를 사용하여 DOCX를 TXT로 저장합니다.

다음 코드 샘플은 Python에서 DOCX를 TXT로 변환하는 방법을 보여줍니다.

import aspose.words as aw

# Load DOC/DOCX document
doc = aw.Document("Input.docx")

# Save as TXT
doc.save("Output.txt")

무료 라이선스 받기

평가 제한 없이 Aspose.Words for Python을 사용하려면 무료 임시 라이선스를 얻으십시오.

결론

이 기사에서는 Python에서 DOC 또는 DOCX 파일을 TXT 형식으로 변환하는 방법을 배웠습니다. 이 기능을 사용하면 DOCX 파일에서 텍스트를 추출하여 일반 TXT 파일 형식으로 저장할 수 있습니다. 따라서 보다 편리하게 텍스트를 분석할 수 있습니다. 또한 문서를 사용하여 라이브러리에 대해 자세히 알아볼 수 있습니다. 또한 포럼을 통해 질문이나 질문을 공유할 수 있습니다.

또한보십시오