이 기사는 Python 애플리케이션의 Word DOCX 또는 DOC 파일에서 일반 텍스트를 추출하는 가장 간단한 방법을 제공합니다. 이 기사를 읽은 후 Python에서 DOCX 또는 DOC 파일을 TXT로 변환하는 방법을 배웁니다.

Python에서 DOC DOCX를 TXT로 변환

MS Word는 서식 있는 텍스트 문서를 만들 수 있는 인기 있는 워드 프로세싱 응용 프로그램입니다. 송장, 기술 문서, 보고서 등 다양한 문서가 MS Word에서 작성되고 있습니다. DOC 및 DOCX는 MS Word에서 문서를 저장하는 데 사용하는 파일 형식입니다.

프로그래머는 Python 응용 프로그램 내에서 일반 텍스트를 추출하기 위해 많은 Word DOC/DOCX 파일을 처리해야 할 수 있습니다. Python에서 DOC 또는 DOCX를 TXT로 변환하는 방법을 살펴보겠습니다.

Python DOCX to TXT 변환기 - 무료 다운로드

Aspose.Words for Python은 DOC 및 DOCX를 포함하여 널리 사용되는 텍스트 문서를 조작할 수 있는 광범위한 기능을 갖춘 놀라운 라이브러리입니다. 라이브러리는 Word 문서에서 텍스트를 처리하고 검색하는 방법을 용이하게 합니다. 따라서 이 라이브러리를 사용하여 DOC/DOCX 파일을 TXT 형식으로 변환합니다.

다음 pip 명령을 사용하여 애플리케이션에 Aspose.Words for Python을 설치할 수 있습니다.

pip install aspose-words

Python에서 DOCX를 TXT로 변환하는 방법

Aspose.Words for Python은 아래에 언급된 것처럼 몇 단계 내에서 수행할 수 있는 DOCX에서 TXT로의 변환을 단순화합니다.

  • 디스크에서 DOCX 파일을 로드합니다.
  • DOCX를 TXT 형식으로 원하는 위치에 저장합니다.

전체 Word 문서에서 텍스트를 추출하기 위해 페이지별로 또는 한 줄씩 구문 분석할 필요가 없습니다. 이제 Python에서 이러한 단계를 수행하여 DOCX 파일을 TXT 형식으로 변환하는 방법을 살펴보겠습니다.

Python에서 DOC를 TXT로 저장

다음은 Python에서 DOC 또는 DOCX 파일을 TXT로 저장하는 단계입니다.

  • Document 클래스를 사용하여 DOC 파일을 로드합니다.
  • Document.save(filePath) 메서드를 사용하여 DOC를 TXT로 저장하고 파일의 경로를 매개변수로 전달합니다.

다음 코드 샘플은 Python에서 DOC를 TXT로 변환하는 방법을 보여줍니다.

import aspose.words as aw

# DOC 파일 로드
doc = aw.Document("document.doc")

# DOC를 TXT로 저장
doc.save("doc-to-text.txt")

Python DOC to TXT 변환기 - 무료 라이선스 받기

무료 임시 라이선스를 사용하여 평가 제한 없이 DOC 파일을 TXT 형식으로 변환할 수 있습니다.

결론

이 기사에서는 Python에서 DOC 또는 DOCX 파일을 TXT 형식으로 변환하는 방법을 배웠습니다. 코드 샘플의 도움으로 DOCX 파일을 Python에서 원하는 위치에 TXT로 로드하고 저장하는 방법을 보았습니다. 또한 Aspose.Words for Python 문서를 방문하여 라이브러리에 대해 자세히 알아볼 수 있습니다. 질문이 있는 경우 포럼을 통해 언제든지 알려주십시오.

또한보십시오