In bestimmten Fällen müssen Sie die großen Word Dokumente aufteilen, indem Sie sie in kleinere aufteilen. Sie können ein Word Dokument nach Seiten, Abschnitten oder Spalten aufteilen. In diesem Artikel erfahren Sie, wie Sie ein Word Dokument mit Python in mehrere Dateien aufteilen. Die Schritt-für-Schritt-Anleitung und die Codebeispiele zeigen, wie Sie ein Word Dokument programmgesteuert nach Abschnitten, Seiten oder Seitenbereichen aufteilen.
- Python Bibliothek zum Aufteilen von MS Word Dokumenten
- Teilen Sie ein Word Dokument nach Abschnitten
- Aufteilen eines Word Dokuments nach Seiten
- Teilen Sie ein Word Dokument nach einem Seitenbereich
Python Bibliothek zum Aufteilen von MS Word Dokumenten
Um ein DOCX oder DOC-Dokument in mehrere Dateien aufzuteilen, verwenden wir Aspose.Words for Python. Es ist eine Textverarbeitungsbibliothek zum Erstellen und Bearbeiten von Word Dokumenten. Sie können es in Ihren Python Anwendungen von PyPI mit dem folgenden Pip Befehl installieren.
pip install aspose-words
Teilen Sie ein Word Dokument nach Abschnitten in Python
In den meisten Fällen wird das Word Dokument mithilfe von Abschnittsumbrüchen in mehrere Abschnitte unterteilt. Um jeden Abschnitt in einer separaten Datei zu speichern, können Sie das Dokument nach Abschnitten aufteilen. Die folgenden Schritte zeigen, wie Sie ein Word Dokument in Python nach Abschnitten aufteilen.
- Laden Sie das Word Dokument mithilfe der Document Klasse.
- Schleifen Sie jeden Abschnitt in der Document.sections Sammlung durch.
- Führen Sie für jeden Abschnitt in der Sammlung die folgenden Schritte aus:
- Erstellen Sie ein neues Objekt der Document Klasse.
- Löschen Sie die Standardabschnitte mit der methode Document.sections.clear().
- Importieren Sie den Abschnitt mithilfe der Methode Document.import\node(Section, True).as\section() in ein neues Dokument und erhalten Sie den zurückgegebenen Abschnitt in einem Objekt.
- Zurückgegebenen Abschnitt zur Abschnittssammlung des neuen Dokuments hinzufügen.
- Speichern Sie das neue Dokument als DOCX Datei mit der methode Document.save(string).
Das folgende Codebeispiel zeigt, wie Sie ein Word Dokument in Python nach Abschnitten aufteilen.
import aspose.words as aw
# load Word document
doc = aw.Document("document.docx")
for i in range(0, doc.sections.count) :
# clone the section to split
section = doc.sections[i].clone()
# create an instance of Document class for new doucment
newDoc = aw.Document()
# clear the default sections
newDoc.sections.clear()
# inster section into new document
newSection = newDoc.import_node(section, True).as_section()
newDoc.sections.add(newSection)
# Save section as a separate document
newDoc.save(f"split_by_sections_{i}.docx")
Aufteilen eines Word Dokuments nach Seiten in Python
Sehen wir uns nun an, wie Sie jede Seite des Dokuments aufteilen und als separate DOCX Datei speichern. Im Folgenden sind die Schritte zum Aufteilen eines Word Dokuments nach Seiten aufgeführt.
Laden Sie das Word Dokument mithilfe der Document Klasse.
Rufen Sie die Seitenzahl im Dokument mit der Eigenschaft Document.page\count ab.
Durchlaufen Sie die Seitenanzahl und führen Sie bei jeder Iteration die folgenden Schritte aus:
Extrahieren Sie die Seite mithilfe der Methode Document.extract\pages(pageIndex, 1) in ein Objekt.
Speichern Sie die extrahierte Seite mit der methode Document.save(string) als DOCX Datei.
Das folgende Codebeispiel zeigt, wie ein Word Dokument nach Seiten aufgeteilt wird.
import aspose.words as aw
# load Word document
doc = aw.Document("document.docx")
# get page count
pageCount = doc.page_count
# loop through pages
for page in range(0, pageCount):
# save each page as a separate document
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"split_by_page_{page + 1}.docx")
Teilen Sie ein Word Dokument nach einem Seitenbereich in Python
Sie können auch mehrere Seiten in einem Word Dokument aufteilen und als separate Datei speichern. Im Folgenden sind die Schritte aufgeführt, um dies in Python zu erreichen.
- Laden Sie das Word Dokument mithilfe der Document Klasse.
- Extrahieren Sie die Seiten mit der methode Document.extract\pages(int, int), wobei der erste Parameter der Index der Startseite und der zweite die Anzahl der Seiten ist.
- Speichern Sie den extrahierten Seitenbereich mit der methode Document.save(string) als DOCX Datei.
Das folgende Codebeispiel zeigt, wie Sie einen Seitenbereich aus einem Word Dokument extrahieren und als DOCX Datei speichern.
import aspose.words as aw
# load Word document
doc = aw.Document("document.docx")
# extract range of pages
extractedPages = doc.extract_pages(3, 6)
# save pages as a separate document
extractedPages.save("split_by_page_range.docx")
Holen Sie sich eine kostenlose API Lizenz
Sind Sie daran interessiert, Aspose.Words for Python kostenlos auszuprobieren? Besorgen Sie sich eine temporäre Lizenz, um Evaluierungseinschränkungen zu vermeiden.
Fazit
In diesem Artikel haben Sie gelernt, wie Sie ein Word Dokument in Python in mehrere Dokumente aufteilen. Die Codebeispiele haben gezeigt, wie ein Word Dokument nach Abschnitten, Seiten oder einem Seitenbereich aufgeteilt wird. Aspose.Words for Python bietet auch eine Reihe spannender Funktionen, die Sie mithilfe der Dokumentation erkunden können. Sie können Ihre Fragen auch in unserem Forum posten.