Podziel dokumenty programu Word na wiele plików w Python

W niektórych przypadkach musisz podzielić duże dokumenty programu Word, dzieląc je na mniejsze. Dokument programu Word można podzielić według stron, sekcji lub kolumn. W tym artykule dowiesz się, jak podzielić dokument Worda na wiele plików za pomocą Python. Przewodnik krok po kroku i przykłady kodu pokażą, jak programowo podzielić dokument programu Word na sekcje, strony lub zakresy stron.

Biblioteka Python do dzielenia dokumentów MS Word

Aby podzielić dokument DOCX lub DOC na wiele plików, użyjemy Aspose.Words for Python. Jest to biblioteka edytora tekstu do tworzenia i manipulowania dokumentami programu Word. Możesz zainstalować go w swoich aplikacjach Python z PyPI za pomocą następującego polecenia pip.

pip install aspose-words 

Podziel dokument programu Word na sekcje w Python

W większości przypadków dokument programu Word jest podzielony na wiele sekcji za pomocą podziałów sekcji. Aby zapisać każdą sekcję w oddzielnym pliku, możesz podzielić dokument na sekcje. Poniższe kroki pokazują, jak podzielić dokument programu Word na sekcje w języku Python.

  • Załaduj dokument programu Word przy użyciu klasy Document.
  • Zapętl każdą sekcję w kolekcji Document.sections.
  • Dla każdej sekcji w kolekcji wykonaj następujące czynności:
    • Utwórz nowy obiekt klasy Document.
    • Wyczyść domyślne sekcje za pomocą metody Document.sections.clear() .
    • Zaimportuj sekcję do nowego dokumentu za pomocą metody Document.importnode(Section, True).assection() i pobierz zwróconą sekcję w obiekcie.
    • Dodaj zwróconą sekcję do kolekcji sekcji nowego dokumentu.
    • Zapisz nowy dokument jako plik DOCX, używając metody Document.save(string).

Poniższy przykładowy kod pokazuje, jak podzielić dokument programu Word według sekcji w języku Python.

import aspose.words as aw

# załaduj dokument Worda
doc = aw.Document("document.docx")

for i in range(0, doc.sections.count) :
            
    # sklonuj sekcję do podziału
    section = doc.sections[i].clone()

    # utwórz instancję klasy Document dla nowego dokumentu
    newDoc = aw.Document()
    
    # wyczyść sekcje domyślne
    newDoc.sections.clear()

    # wstaw sekcję do nowego dokumentu
    newSection = newDoc.import_node(section, True).as_section()
    newDoc.sections.add(newSection)

    # Zapisz sekcję jako osobny dokument
    newDoc.save(f"split_by_sections_{i}.docx")

Dzielenie dokumentu programu Word na strony w Python

Teraz przyjrzyjmy się, jak podzielić każdą stronę dokumentu i zapisać ją jako osobny plik DOCX. Poniżej przedstawiono kroki, aby podzielić dokument programu Word na strony.

  • Załaduj dokument programu Word przy użyciu klasy Document.

  • Uzyskaj liczbę stron w dokumencie za pomocą właściwości Document.pagecount.

  • Przejrzyj w pętli liczbę stron i w każdej iteracji wykonaj następujące kroki:

    • Wyodrębnij stronę do obiektu przy użyciu metody Document.extractpages(pageIndex, 1).

    • Zapisz wyodrębnioną stronę jako plik DOCX, używając metody Document.save(string).

Poniższy przykładowy kod pokazuje, jak podzielić dokument programu Word według stron.

import aspose.words as aw

# załaduj dokument Worda
doc = aw.Document("document.docx")

# uzyskać liczbę stron
pageCount = doc.page_count

# przewijać strony
for page in range(0, pageCount):
  
    # zapisz każdą stronę jako osobny dokument
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"split_by_page_{page + 1}.docx")

Podziel dokument programu Word według zakresu stron w Python

Możesz także podzielić zakres stron w dokumencie programu Word i zapisać go jako osobny plik. Poniżej przedstawiono kroki, aby to osiągnąć w Python.

  • Załaduj dokument programu Word przy użyciu klasy Document.
  • Wyodrębnij strony za pomocą metody Document.extractpages(int, int), gdzie pierwszym parametrem jest indeks strony startowej, a drugim liczba stron.
  • Zapisz wyodrębniony zakres stron jako plik DOCX, używając metody Document.save(string).

Poniższy przykładowy kod pokazuje, jak wyodrębnić zakres stron z dokumentu programu Word i zapisać go jako plik DOCX.

import aspose.words as aw

# załaduj dokument Worda
doc = aw.Document("document.docx")

# wyodrębnić zakres stron
extractedPages = doc.extract_pages(3, 6)

# zapisz strony jako osobny dokument
extractedPages.save("split_by_page_range.docx")

Uzyskaj bezpłatną licencję API

Czy jesteś zainteresowany wypróbowaniem Aspose.Words for Python za darmo? Uzyskaj tymczasową licencję, aby uniknąć ograniczeń ewaluacyjnych.

Wniosek

W tym artykule nauczyłeś się, jak podzielić dokument programu Word na wiele dokumentów w Python. Przykłady kodu pokazały, jak podzielić dokument programu Word według sekcji, stron lub zakresu stron. Aspose.Words for Python zapewnia również szereg ekscytujących funkcji, które można eksplorować za pomocą dokumentacji. Możesz także zadawać pytania na naszym forum.

Zobacz też