Teilen Sie Word Dokumente in Python in mehrere Dateien auf

In bestimmten Fällen müssen Sie die großen Word Dokumente aufteilen, indem Sie sie in kleinere aufteilen. Sie können ein Word Dokument nach Seiten, Abschnitten oder Spalten aufteilen. In diesem Artikel erfahren Sie, wie Sie ein Word Dokument mit Python in mehrere Dateien aufteilen. Die Schritt-für-Schritt-Anleitung und die Codebeispiele zeigen, wie Sie ein Word Dokument programmgesteuert nach Abschnitten, Seiten oder Seitenbereichen aufteilen.

Python Bibliothek zum Aufteilen von MS Word Dokumenten

Um ein DOCX oder DOC-Dokument in mehrere Dateien aufzuteilen, verwenden wir Aspose.Words for Python. Es ist eine Textverarbeitungsbibliothek zum Erstellen und Bearbeiten von Word Dokumenten. Sie können es in Ihren Python Anwendungen von PyPI mit dem folgenden Pip Befehl installieren.

pip install aspose-words 

Teilen Sie ein Word Dokument nach Abschnitten in Python

In den meisten Fällen wird das Word Dokument mithilfe von Abschnittsumbrüchen in mehrere Abschnitte unterteilt. Um jeden Abschnitt in einer separaten Datei zu speichern, können Sie das Dokument nach Abschnitten aufteilen. Die folgenden Schritte zeigen, wie Sie ein Word Dokument in Python nach Abschnitten aufteilen.

  • Laden Sie das Word Dokument mithilfe der Document Klasse.
  • Schleifen Sie jeden Abschnitt in der Document.sections Sammlung durch.
  • Führen Sie für jeden Abschnitt in der Sammlung die folgenden Schritte aus:
    • Erstellen Sie ein neues Objekt der Document Klasse.
    • Löschen Sie die Standardabschnitte mit der methode Document.sections.clear().
    • Importieren Sie den Abschnitt mithilfe der Methode Document.import\node(Section, True).as\section() in ein neues Dokument und erhalten Sie den zurückgegebenen Abschnitt in einem Objekt.
    • Zurückgegebenen Abschnitt zur Abschnittssammlung des neuen Dokuments hinzufügen.
    • Speichern Sie das neue Dokument als DOCX Datei mit der methode Document.save(string).

Das folgende Codebeispiel zeigt, wie Sie ein Word Dokument in Python nach Abschnitten aufteilen.

import aspose.words as aw

# load Word document
doc = aw.Document("document.docx")

for i in range(0, doc.sections.count) :
            
    # clone the section to split
    section = doc.sections[i].clone()

    # create an instance of Document class for new doucment
    newDoc = aw.Document()
    
    # clear the default sections
    newDoc.sections.clear()

    # inster section into new document
    newSection = newDoc.import_node(section, True).as_section()
    newDoc.sections.add(newSection)

    # Save section as a separate document
    newDoc.save(f"split_by_sections_{i}.docx")

Aufteilen eines Word Dokuments nach Seiten in Python

Sehen wir uns nun an, wie Sie jede Seite des Dokuments aufteilen und als separate DOCX Datei speichern. Im Folgenden sind die Schritte zum Aufteilen eines Word Dokuments nach Seiten aufgeführt.

  • Laden Sie das Word Dokument mithilfe der Document Klasse.

  • Rufen Sie die Seitenzahl im Dokument mit der Eigenschaft Document.page\count ab.

  • Durchlaufen Sie die Seitenanzahl und führen Sie bei jeder Iteration die folgenden Schritte aus:

    • Extrahieren Sie die Seite mithilfe der Methode Document.extract\pages(pageIndex, 1) in ein Objekt.

    • Speichern Sie die extrahierte Seite mit der methode Document.save(string) als DOCX Datei.

Das folgende Codebeispiel zeigt, wie ein Word Dokument nach Seiten aufgeteilt wird.

import aspose.words as aw

# load Word document
doc = aw.Document("document.docx")

# get page count
pageCount = doc.page_count

# loop through pages
for page in range(0, pageCount):
  
    # save each page as a separate document
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"split_by_page_{page + 1}.docx")

Teilen Sie ein Word Dokument nach einem Seitenbereich in Python

Sie können auch mehrere Seiten in einem Word Dokument aufteilen und als separate Datei speichern. Im Folgenden sind die Schritte aufgeführt, um dies in Python zu erreichen.

  • Laden Sie das Word Dokument mithilfe der Document Klasse.
  • Extrahieren Sie die Seiten mit der methode Document.extract\pages(int, int), wobei der erste Parameter der Index der Startseite und der zweite die Anzahl der Seiten ist.
  • Speichern Sie den extrahierten Seitenbereich mit der methode Document.save(string) als DOCX Datei.

Das folgende Codebeispiel zeigt, wie Sie einen Seitenbereich aus einem Word Dokument extrahieren und als DOCX Datei speichern.

import aspose.words as aw

# load Word document
doc = aw.Document("document.docx")

# extract range of pages
extractedPages = doc.extract_pages(3, 6)

# save pages as a separate document
extractedPages.save("split_by_page_range.docx")

Holen Sie sich eine kostenlose API Lizenz

Sind Sie daran interessiert, Aspose.Words for Python kostenlos auszuprobieren? Besorgen Sie sich eine temporäre Lizenz, um Evaluierungseinschränkungen zu vermeiden.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie ein Word Dokument in Python in mehrere Dokumente aufteilen. Die Codebeispiele haben gezeigt, wie ein Word Dokument nach Abschnitten, Seiten oder einem Seitenbereich aufgeteilt wird. Aspose.Words for Python bietet auch eine Reihe spannender Funktionen, die Sie mithilfe der Dokumentation erkunden können. Sie können Ihre Fragen auch in unserem Forum posten.

Siehe auch