Rozdělte dokumenty Word do více souborů v Python

V určitých případech je nutné rozdělit velké dokumenty aplikace Word jejich rozdělením na menší. Dokument aplikace Word můžete rozdělit podle stránek, oddílů nebo sloupců. V tomto článku se dozvíte, jak rozdělit dokument Wordu do více souborů pomocí Python. Podrobný průvodce a ukázky kódu demonstrují, jak programově rozdělit dokument aplikace Word podle oddílů, stránek nebo rozsahů stránek.

Knihovna Python pro rozdělení dokumentů MS Word

K rozdělení dokumentu DOCX nebo DOC do více souborů použijeme Aspose.Words for Python. Je to knihovna pro zpracování textu pro vytváření a manipulaci s dokumenty aplikace Word. Můžete jej nainstalovat do svých aplikací Python z PyPI pomocí následujícího příkazu pip.

pip install aspose-words 

Rozdělte dokument Word podle sekcí v Python

Ve většině případů je dokument aplikace Word rozdělen do více částí pomocí konců oddílů. Chcete-li uložit každý oddíl do samostatného souboru, můžete dokument rozdělit na oddíly. Následující kroky ukazují, jak rozdělit dokument aplikace Word podle sekcí v Python.

  • Načtěte dokument aplikace Word pomocí třídy Document.
  • Smyčku projděte každou sekci v kolekci Document.sections.
  • Pro každou sekci v kolekci proveďte následující kroky:
    • Vytvořte nový objekt třídy Document.
    • Vymažte výchozí sekce pomocí metody Document.sections.clear().
    • Importujte sekci do nového dokumentu pomocí metody Document.importnode(Section, True).assection() a získejte vrácenou sekci v objektu.
    • Přidejte vrácený oddíl do kolekce oddílů nového dokumentu.
    • Uložte nový dokument jako soubor DOCX pomocí metody Document.save(string).

Následující ukázka kódu ukazuje, jak rozdělit dokument aplikace Word podle sekcí v Python.

import aspose.words as aw

# načíst dokument aplikace Word
doc = aw.Document("document.docx")

for i in range(0, doc.sections.count) :
            
    # klonujte sekci k rozdělení
    section = doc.sections[i].clone()

    # vytvořte instanci třídy Document pro nový dokument
    newDoc = aw.Document()
    
    # vymazat výchozí sekce
    newDoc.sections.clear()

    # vložit oddíl do nového dokumentu
    newSection = newDoc.import_node(section, True).as_section()
    newDoc.sections.add(newSection)

    # Uložte sekci jako samostatný dokument
    newDoc.save(f"split_by_sections_{i}.docx")

Rozdělení dokumentu aplikace Word podle stránek v Python

Nyní se podívejme na to, jak rozdělit každou stránku dokumentu a uložit ji jako samostatný soubor DOCX. Následují kroky k rozdělení dokumentu aplikace Word podle stránek.

  • Načtěte dokument aplikace Word pomocí třídy Document.

  • Získejte počet stránek v dokumentu pomocí vlastnosti Document.pagecount.

  • Projděte počet stránek a v každé iteraci proveďte následující kroky:

    • Extrahujte stránku do objektu pomocí metody Document.extractpages(pageIndex, 1).

    • Uložte extrahovanou stránku jako soubor DOCX pomocí metody Document.save(string).

Následující ukázka kódu ukazuje, jak rozdělit dokument aplikace Word podle stránek.

import aspose.words as aw

# načíst dokument aplikace Word
doc = aw.Document("document.docx")

# získat počet stránek
pageCount = doc.page_count

# procházet stránkami
for page in range(0, pageCount):
  
    # uložit každou stránku jako samostatný dokument
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"split_by_page_{page + 1}.docx")

Rozdělit dokument aplikace Word podle rozsahu stránek v Python

Můžete také rozdělit rozsah stránek v dokumentu aplikace Word a uložit jej jako samostatný soubor. Níže jsou uvedeny kroky, jak toho v Python dosáhnout.

  • Načtěte dokument aplikace Word pomocí třídy Document.
  • Extrahujte stránky pomocí metody Document.extractpages(int, int), kde první parametr je index počáteční stránky a druhý je počet stránek.
  • Uložte extrahovaný rozsah stránek jako soubor DOCX pomocí metody Document.save(string).

Následující ukázka kódu ukazuje, jak extrahovat rozsah stránek z dokumentu aplikace Word a uložit jej jako soubor DOCX.

import aspose.words as aw

# načíst dokument aplikace Word
doc = aw.Document("document.docx")

# extrahovat rozsah stránek
extractedPages = doc.extract_pages(3, 6)

# uložit stránky jako samostatný dokument
extractedPages.save("split_by_page_range.docx")

Získejte bezplatnou licenci API

Máte zájem vyzkoušet Aspose.Words for Python zdarma? Získejte dočasnou licenci, abyste se vyhnuli omezením hodnocení.

Závěr

V tomto článku jste se naučili, jak rozdělit dokument Wordu do více dokumentů v Python. Ukázky kódu ukazují, jak rozdělit dokument aplikace Word podle oddílů, stránek nebo rozsahu stránek. Aspose.Words for Python také poskytuje řadu zajímavých funkcí, které můžete prozkoumat pomocí dokumentace. Své dotazy můžete také zveřejňovat na našem fóru.

Viz také