Python에서 PDF를 Word로 변환

PDF는 문서 공유 및 인쇄에 일반적으로 사용되는 파일 형식입니다. 그러나 어떤 경우에는 PDF 파일을 Word DOCX 또는 DOC 형식으로 변환하여 텍스트를 구문 분석하거나 문서를 편집 가능하게 만듭니다. 이러한 시나리오의 경우 이 문서에서는 Python을 사용하여 PDF 파일을 Word 문서로 변환하는 방법을 다룹니다. 또한 PDF 파일의 로드를 동적으로 제어하기 위해 다양한 로드 옵션을 지정하는 방법을 배우게 됩니다.

Python PDF를 Word 변환기 라이브러리로

PDF 파일을 Word 형식으로 변환하기 위해 Aspose.Words for Python을 사용합니다. Word 문서를 생성, 조작 및 변환하는 기능이 풍부한 Python 라이브러리입니다. 또한 Word 및 PDF 문서를 고품질로 앞뒤로 변환할 수 있습니다. Aspose.Words for Python은 PyPI에서 호스팅되며 다음 pip 명령을 사용하여 설치할 수 있습니다.

pip install aspose-words

Python에서 PDF 파일을 Word DOCX로 변환

Python용 Aspose.Words를 사용하면 몇 단계 만에 PDF 파일을 Word DOCX 형식으로 변환할 수 있습니다. PDF 파일을 로드하고 Word 문서로 저장하기만 하면 됩니다. 다음은 Python에서 PDF 파일을 DOCX 형식으로 변환하는 단계입니다.

  • Document 클래스를 사용하여 PDF 파일을 로드합니다.
  • Document.save() 메서드를 사용하여 PDF 파일을 Word 문서로 저장합니다.

다음 코드 샘플은 PDF 파일을 Word DOCX 형식으로 변환하는 방법을 보여줍니다.

import aspose.words as aw

# load the PDF file
doc = aw.Document("PDF.pdf")

# convert PDF to Word DOCX format
doc.save("pdf-to-word.docx")

PDF에서 Word로 변환 로드 옵션 지정

Aspose.Words for Python을 사용하면 요구 사항에 따라 PDF 문서 로드를 사용자 정의할 수도 있습니다. 예를 들어, PDF의 페이지 범위만 로드하고, 이미지를 건너뛰고, 암호화된 파일에 대한 암호를 지정할 수 있습니다. 로드 옵션을 설정하기 위해 PdfLoadOptions 클래스가 사용됩니다. 다음은 PDF에서 Word로 변환에서 로드 옵션을 지정하는 단계입니다.

  • PdfLoadOptions 클래스의 인스턴스를 만듭니다.
  • PdfLoadOptions.loadformat 속성을 사용하여 로드 형식을 지정합니다.
  • skippdfimages, pageindex, pagecount 등과 같은 옵션을 설정합니다.
  • Document 클래스를 사용하여 경로와 PdfLoadOptions를 매개변수로 전달하여 PDF 파일을 로드합니다.
  • Document.save() 메서드를 사용하여 PDF 파일을 Word 문서로 저장합니다.

다음 코드 샘플은 Python을 사용하여 PDF에서 DOCX로의 변환에서 로드 옵션을 지정하는 방법을 보여줍니다.

import aspose.words as aw

# create PDF load options
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF 

# set index of the starting page and page count
loadOptions.page_index = 0
loadOptions.page_count = 1

# skip images in PDF
loadOptions.skip_pdf_images = True

# to set password for encrypted PDF files
#loadOptions.password = "12345" 

# load PDF file
doc = aw.Document("PDF.pdf", loadOptions)

# convert PDF to Word
doc.save("pdf-to-word.docx")

무료 API 라이선스 받기

평가 제한 없이 Aspose.Words for Python을 사용하려면 임시 라이선스를 취득할 수 있습니다.

결론

이 기사에서는 PDF 파일을 Python에서 Word DOCX 또는 DOC 형식으로 변환하는 방법을 배웠습니다. 또한 PDF 파일에 대해 다양한 로드 옵션을 동적으로 지정하는 방법을 살펴보았습니다. Aspose.Words for Python은 문서를 사용하여 탐색할 수 있는 다양한 기타 기능을 제공합니다. 또한 포럼을 통해 질문할 수 있습니다.

또한보십시오