Python에서 Word 문서를 여러 파일로 분할

어떤 경우에는 큰 Word 문서를 작은 문서로 나누어 분할해야 합니다. Word 문서를 페이지, 섹션 또는 열로 분할할 수 있습니다. 이 기사에서는 Python을 사용하여 Word 문서를 여러 파일로 분할하는 방법을 배웁니다. 단계별 가이드 및 코드 샘플은 프로그래밍 방식으로 섹션, 페이지 또는 페이지 범위별로 Word 문서를 분할하는 방법을 보여줍니다.

MS Word 문서를 분할하는 Python 라이브러리

DOCX 또는 DOC 문서를 여러 파일로 분할하려면 Aspose.Words for Python을 사용합니다. 워드 문서를 만들고 조작하는 워드 프로세싱 라이브러리입니다. 다음 pip 명령을 사용하여 PyPI에서 Python 애플리케이션에 설치할 수 있습니다.

pip install aspose-words 

Python에서 섹션별로 Word 문서 분할

대부분의 경우 Word 문서는 구역 나누기를 사용하여 여러 구역으로 나뉩니다. 각 섹션을 별도의 파일로 저장하려면 문서를 섹션별로 분할할 수 있습니다. 다음 단계는 Python에서 Word 문서를 섹션별로 분할하는 방법을 보여줍니다.

  • Document 클래스를 사용하여 Word 문서를 로드합니다.
  • Document.sections 컬렉션의 각 섹션을 반복합니다.
  • 컬렉션의 각 섹션에 대해 다음 단계를 수행합니다.
    • Document 클래스의 새 개체를 만듭니다.
    • Document.sections.clear() 메서드를 사용하여 기본 섹션을 지웁니다.
    • Document.import\node(Section, True).as\section() 메서드를 사용하여 새 문서로 섹션을 가져오고 객체에서 반환된 섹션을 가져옵니다.
    • 새 문서의 섹션 컬렉션에 반환된 섹션을 추가합니다.
    • Document.save(string) 메서드를 사용하여 새 문서를 DOCX 파일로 저장합니다.

다음 코드 샘플은 Python에서 Word 문서를 섹션별로 분할하는 방법을 보여줍니다.

import aspose.words as aw

# load Word document
doc = aw.Document("document.docx")

for i in range(0, doc.sections.count) :
            
    # clone the section to split
    section = doc.sections[i].clone()

    # create an instance of Document class for new doucment
    newDoc = aw.Document()
    
    # clear the default sections
    newDoc.sections.clear()

    # inster section into new document
    newSection = newDoc.import_node(section, True).as_section()
    newDoc.sections.add(newSection)

    # Save section as a separate document
    newDoc.save(f"split_by_sections_{i}.docx")

Python에서 페이지별로 Word 문서 분할

이제 문서의 각 페이지를 분할하여 별도의 DOCX 파일로 저장하는 방법을 살펴보겠습니다. 다음은 Word 문서를 페이지별로 분할하는 단계입니다.

  • Document 클래스를 사용하여 Word 문서를 로드합니다.

  • Document.page\count 속성을 사용하여 문서의 페이지 수를 가져옵니다.

  • 페이지 수를 반복하고 각 반복에서 다음 단계를 수행합니다.

    • Document.extract\pages(pageIndex, 1) 메서드를 사용하여 페이지를 객체로 추출합니다.

    • Document.save(string) 메서드를 사용하여 추출된 페이지를 DOCX 파일로 저장합니다.

다음 코드 샘플은 Word 문서를 페이지별로 분할하는 방법을 보여줍니다.

import aspose.words as aw

# load Word document
doc = aw.Document("document.docx")

# get page count
pageCount = doc.page_count

# loop through pages
for page in range(0, pageCount):
  
    # save each page as a separate document
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"split_by_page_{page + 1}.docx")

Python에서 페이지 범위로 Word 문서 분할

Word 문서에서 페이지 범위를 분할하여 별도의 파일로 저장할 수도 있습니다. 다음은 Python에서 이를 달성하는 단계입니다.

  • Document 클래스를 사용하여 Word 문서를 로드합니다.
  • Document.extract\pages(int, int) 메서드를 사용하여 페이지를 추출합니다. 여기서 첫 번째 매개변수는 시작 페이지의 인덱스이고 두 번째 매개변수는 페이지 수입니다.
  • Document.save(string) 메서드를 사용하여 추출된 페이지 범위를 DOCX 파일로 저장합니다.

다음 코드 샘플은 Word 문서에서 페이지 범위를 추출하고 DOCX 파일로 저장하는 방법을 보여줍니다.

import aspose.words as aw

# load Word document
doc = aw.Document("document.docx")

# extract range of pages
extractedPages = doc.extract_pages(3, 6)

# save pages as a separate document
extractedPages.save("split_by_page_range.docx")

무료 API 라이선스 받기

Aspose.Words for Python을 무료로 사용해 보고 싶으십니까? 평가 제한을 피하기 위해 임시 라이선스 받기.

결론

이 기사에서는 Python에서 Word 문서를 여러 문서로 분할하는 방법을 배웠습니다. 코드 샘플은 섹션, 페이지 또는 페이지 범위별로 Word 문서를 분할하는 방법을 보여주었습니다. Aspose.Words for Python은 또한 문서를 사용하여 탐색할 수 있는 여러 가지 흥미로운 기능을 제공합니다. 또한 포럼에 질문을 게시할 수 있습니다.

또한보십시오