Pisahkan Dokumen Word menjadi Banyak File dengan Python

Dalam kasus tertentu, Anda perlu membagi dokumen Word yang besar dengan memecahnya menjadi lebih kecil. Anda dapat memisahkan dokumen Word berdasarkan halaman, bagian, atau kolom. Pada artikel ini, Anda akan belajar cara membagi dokumen Word menjadi beberapa file menggunakan Python. Panduan langkah demi langkah dan contoh kode akan menunjukkan cara membagi dokumen Word berdasarkan bagian, halaman, atau rentang halaman secara terprogram.

Perpustakaan Python untuk Membagi Dokumen MS Word

Untuk memisahkan dokumen DOCX atau DOC menjadi beberapa file, kita akan menggunakan Aspose.Words for Python. Ini adalah perpustakaan pengolah kata untuk membuat dan memanipulasi dokumen Word. Anda dapat menginstalnya di aplikasi Python Anda dari PyPI menggunakan perintah pip berikut.

pip install aspose-words 

Pisahkan Dokumen Word menjadi Bagian dengan Python

Dalam kebanyakan kasus, dokumen Word dibagi menjadi beberapa bagian menggunakan Hentian bagian. Untuk menyimpan setiap bagian ke dalam file terpisah, Anda dapat membagi dokumen menjadi beberapa bagian. Langkah-langkah berikut menunjukkan cara membagi dokumen Word menjadi beberapa bagian dengan Python.

  • Muat dokumen Word menggunakan kelas Document.
  • Ulangi setiap bagian dalam koleksi Document.sections.
  • Untuk setiap bagian dalam koleksi, lakukan langkah-langkah berikut:
    • Buat objek baru dari kelas Document.
    • Hapus bagian default menggunakan metode Document.sections.clear().
    • Impor bagian ke dalam dokumen baru menggunakan metode Document.importnode(Section, True).assection() dan dapatkan Bagian yang dikembalikan dalam sebuah objek.
    • Tambahkan Bagian yang dikembalikan ke kumpulan bagian dari dokumen baru.
    • Simpan dokumen baru sebagai file DOCX menggunakan metode Document.save(string).

Contoh kode berikut menunjukkan cara membagi dokumen Word menjadi beberapa bagian dengan Python.

import aspose.words as aw

# memuat dokumen Word
doc = aw.Document("document.docx")

for i in range(0, doc.sections.count) :
            
    # mengkloning bagian untuk membagi
    section = doc.sections[i].clone()

    # buat instance kelas Document untuk dokumen baru
    newDoc = aw.Document()
    
    # menghapus bagian default
    newDoc.sections.clear()

    # masukkan bagian ke dalam dokumen baru
    newSection = newDoc.import_node(section, True).as_section()
    newDoc.sections.add(newSection)

    # Simpan bagian sebagai dokumen terpisah
    newDoc.save(f"split_by_sections_{i}.docx")

Memisahkan Dokumen Word dengan Halaman dengan Python

Sekarang, mari kita lihat cara membagi setiap halaman dokumen dan menyimpannya sebagai file DOCX terpisah. Berikut ini adalah langkah-langkah untuk membagi dokumen Word berdasarkan halaman.

  • Muat dokumen Word menggunakan kelas Document.

  • Dapatkan jumlah halaman dalam dokumen menggunakan properti Document.pagecount.

  • Ulangi jumlah halaman dan di setiap iterasi, lakukan langkah-langkah berikut:

    • Ekstrak halaman menjadi objek menggunakan metode Document.extractpages(pageIndex, 1).

    • Simpan halaman yang diekstraksi sebagai file DOCX menggunakan metode Document.save(string).

Contoh kode berikut menunjukkan cara membagi dokumen Word berdasarkan halaman.

import aspose.words as aw

# memuat dokumen Word
doc = aw.Document("document.docx")

# mendapatkan jumlah halaman
pageCount = doc.page_count

# lingkaran melalui halaman
for page in range(0, pageCount):
  
    # simpan setiap halaman sebagai dokumen terpisah
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"split_by_page_{page + 1}.docx")

Pisahkan Dokumen Word dengan Rentang Halaman dengan Python

Anda juga dapat membagi rentang halaman dalam dokumen Word dan menyimpannya sebagai file terpisah. Berikut ini adalah langkah-langkah untuk mencapainya dengan Python.

  • Muat dokumen Word menggunakan kelas Document.
  • Ekstrak halaman menggunakan metode Document.extractpages(int, int) di mana parameter pertama adalah indeks halaman awal dan yang kedua adalah jumlah halaman.
  • Simpan rentang halaman yang diekstrak sebagai file DOCX menggunakan metode Document.save(string).

Contoh kode berikut menunjukkan cara mengekstrak berbagai halaman dari dokumen Word dan menyimpannya sebagai file DOCX.

import aspose.words as aw

# memuat dokumen Word
doc = aw.Document("document.docx")

# ekstrak berbagai halaman
extractedPages = doc.extract_pages(3, 6)

# menyimpan halaman sebagai dokumen terpisah
extractedPages.save("split_by_page_range.docx")

Dapatkan Lisensi API Gratis

Apakah Anda tertarik untuk mencoba Aspose.Words for Python secara gratis? Dapatkan lisensi sementara untuk menghindari batasan evaluasi.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara membagi dokumen Word menjadi beberapa dokumen dengan Python. Contoh kode telah menunjukkan cara membagi dokumen Word menjadi bagian, halaman, atau rentang halaman. Aspose.Words for Python juga menyediakan sejumlah fitur menarik yang dapat Anda jelajahi menggunakan dokumentasi. Selain itu, Anda dapat memposting pertanyaan Anda ke forum kami.

Lihat juga