PDF는 문서 공유 및 인쇄에 일반적으로 사용되는 파일 형식입니다. 그러나 어떤 경우에는 PDF 파일을 Word DOCX 형식으로 변환하여 텍스트를 구문 분석하거나 문서를 편집 가능하게 만듭니다. 이러한 시나리오의 경우 이 문서에서는 Python에서 PDF를 DOCX로 변환하는 방법을 다룹니다. 또한 PDF 파일의 로드를 동적으로 제어하기 위해 다양한 로드 옵션을 지정하는 방법을 배우게 됩니다.
Python PDF to DOCX 변환기 - 무료 다운로드
PDF 파일을 DOCX 형식으로 변환하기 위해 Aspose.Words for Python을 사용합니다. Word 문서를 생성, 조작 및 변환하는 기능이 풍부한 Python 라이브러리입니다. 또한 Word 및 PDF 문서를 고품질로 앞뒤로 변환할 수 있습니다. Aspose.Words for Python은 PyPI에서 호스팅되며 다음 pip 명령을 사용하여 설치할 수 있습니다.
pip install aspose-words
Python에서 PDF를 DOCX로 변환
Python용 Aspose.Words를 사용하면 몇 단계 만에 PDF 파일을 DOCX로 변환할 수 있습니다. PDF 파일을 로드하고 DOCX 문서로 저장하기만 하면 됩니다. 다음은 Python에서 PDF를 DOCX로 변환하는 단계입니다.
- Document 클래스를 사용하여 PDF 파일을 로드합니다.
- Document.save() 메서드를 사용하여 PDF 파일을 DOCX 문서로 저장합니다.
다음 코드 샘플은 PDF 파일을 DOCX 형식으로 변환하는 방법을 보여줍니다.
import aspose.words as aw
# load the PDF file
doc = aw.Document("PDF.pdf")
# convert PDF to Word DOCX format
doc.save("pdf-to-word.docx")
Python PDF에서 DOCX로 변환 - 로드 옵션 지정
Aspose.Words for Python을 사용하면 요구 사항에 따라 PDF 문서 로드를 사용자 정의할 수도 있습니다. 예를 들어, PDF의 페이지 범위만 로드하고, 이미지를 건너뛰고, 암호화된 파일에 대한 암호를 지정할 수 있습니다. 로드 옵션을 설정하기 위해 PdfLoadOptions 클래스가 사용됩니다. 다음은 Python PDF에서 DOCX로의 변환에서 로드 옵션을 지정하는 단계입니다.
- PdfLoadOptions 클래스의 인스턴스를 만듭니다.
- PdfLoadOptions.load_format 속성을 사용하여 로드 형식을 지정합니다.
- skip_pdf_images, page_index, page_count 등과 같은 옵션을 설정합니다.
- Document 클래스를 사용하여 경로와 PdfLoadOptions를 매개변수로 전달하여 PDF 파일을 로드합니다.
- Document.save() 메서드를 사용하여 PDF 파일을 DOCX 문서로 저장합니다.
다음 코드 샘플은 Python에서 PDF에서 DOCX로의 변환에서 로드 옵션을 지정하는 방법을 보여줍니다.
import aspose.words as aw
# create PDF load options
loadOptions = aw.saving.PdfLoadOptions()
loadOptions.load_format = aw.LoadFormat.PDF
# set index of the starting page and page count
loadOptions.page_index = 0
loadOptions.page_count = 1
# skip images in PDF
loadOptions.skip_pdf_images = True
# to set password for encrypted PDF files
#loadOptions.password = "12345"
# load PDF file
doc = aw.Document("PDF.pdf", loadOptions)
# convert PDF to Word
doc.save("pdf-to-word.docx")
Python PDF to DOCX 변환기 - 무료 라이선스 받기
평가 제한 없이 Aspose.Words for Python을 사용하려면 임시 라이선스를 취득할 수 있습니다.
결론
이 기사에서는 Python에서 PDF 파일을 DOCX로 변환하는 방법을 배웠습니다. 또한 PDF 파일에 대해 다양한 로드 옵션을 동적으로 지정하는 방법을 살펴보았습니다. Aspose.Words for Python은 문서를 사용하여 탐색할 수 있는 다양한 기타 기능을 제공합니다. 또한 포럼을 통해 질문할 수 있습니다.