
אנו יכולים להפוך את MS Word לאוטומטית ליצירת מסמכי Word חדשים (DOC או DOCX), לערוך או לשנות את הקיימים, או להמיר אותם לפורמטים אחרים מבלי להשתמש ב-Microsoft Office. אוטומציה של Python MS Word מאפשרת לבצע את כל הפעולות באופן פרוגרמטי שאנו יכולים לבצע דרך ממשק המשתמש של MS Word. במאמר זה נלמד כיצד להפוך את MS Word לאוטומטי ליצירה, עריכה או המרת מסמכי Word באמצעות Python.
מאמר זה מכסה את כל התכונות הבסיסיות הנדרשות להפקה ולטפל במסמכי Word באופן תוכנתי באמצעות Python. מאמר זה כולל את הנושאים הבאים:
- Python MS Word Automation API ליצירה, עריכה או המרת מסמכי Word
- צור מסמכי וורד
- ערוך או שנה מסמכי Word
- מצא והחלף טקסט במסמכי Word
- המרת מסמכי Word
- ניתוח מסמכי Word
Python MS Word Automation API ליצירה, עריכה או המרת מסמכי Word
עבור אוטומציה של Word, נשתמש ב-Aspose.Words for Python API. זהו פתרון אוטומציה מלא ועשיר בתכונות ליצירה, עריכה או ניתוח של מסמכי Word באופן תכנותי. המחלקה Document של ה-API מייצגת מסמך Word. ה-API מספק את המחלקה DocumentBuilder המציעה שיטות שונות להוספת טקסט, תמונות ותוכן אחר במסמך. מחלקה זו מאפשרת גם לציין את עיצוב הגופן, הפסקה והקטע. מחלקת ההפעלה של ה-API מייצגת רצף של תווים בעלי אותו עיצוב גופן. אנא התקן את הספרייה באפליקציית Python שלך מ-PyPI באמצעות פקודת ה-pip הבאה.
pip install aspose-words
צור מסמכי Word באמצעות Python
אנו יכולים ליצור מסמכי Word באופן פרוגרמטי על ידי ביצוע השלבים המפורטים להלן:
- ראשית, צור מופע של המחלקה Document.
- לאחר מכן, צור מופע של המחלקה DocumentBuilder עם האובייקט Document כארגומנט.
- לאחר מכן, הוסף/כתוב אלמנטים כדי להוסיף טקסט, פסקאות, טבלאות או תמונות באמצעות האובייקט DocumentBuilder.
- לבסוף, קרא למתודה save() עם נתיב קובץ הפלט כארגומנט כדי לשמור את הקובץ שנוצר.
דוגמת הקוד הבאה מראה כיצד ליצור מסמך Word (DOCX) באמצעות Python.
import aspose.words as aw
# דוגמה זו מדגימה כיצד ליצור מסמך Word חדש באמצעות Python.
# צור אובייקט מסמך
doc = aw.Document()
# צור אובייקט של בונה מסמכים
builder = aw.DocumentBuilder(doc)
# ציין עיצוב גופן גופן
font = builder.font
font.size = 32
font.bold = True
font.name = "Arial"
font.underline = aw.Underline.SINGLE
# הוסף טקסט
builder.writeln("Welcome")
builder.writeln()
# הגדר עיצוב פסקה
font.size = 14
font.bold = False
font.name = "Arial"
font.underline = aw.Underline.NONE
paragraphFormat = builder.paragraph_format
paragraphFormat.first_line_indent = 8
paragraphFormat.alignment = aw.ParagraphAlignment.JUSTIFY
paragraphFormat.keep_together = True
# הוסף פסקה
builder.writeln('''Aspose.Words for Python is a class library that enables your applications to perform a great range of document processing tasks.
It supports most of the popular document formats such as DOC, DOCX, RTF, HTML, Markdown, PDF, XPS, EPUB, and others.
With the API, you can generate, modify, convert, render, and print documents without third-party applications or Office Automation.
''')
builder.writeln()
# הכנס טבלה
font.bold = True
builder.writeln("This is a sample table")
font.bold = False
# התחל שולחן
table = builder.start_table()
# הכנס תא
builder.insert_cell()
table.auto_fit(aw.tables.AutoFitBehavior.AUTO_FIT_TO_CONTENTS)
# הגדר עיצוב והוסף טקסט
builder.cell_format.vertical_alignment = aw.tables.CellVerticalAlignment.CENTER
builder.write("Row 1 cell 1")
builder.insert_cell()
builder.write("Row 1 cell 2")
builder.end_row()
builder.insert_cell()
builder.write("Row 2 cell 1")
builder.insert_cell()
builder.write("Row 2 cell 2")
builder.end_row()
# שולחן קצה
builder.end_table()
builder.writeln()
# הוסף תמונה
builder.insert_image("C:\\Files\\aspose-icon.png")
# שמור מסמך
doc.save("C:\\Files\\sample_output.docx")

צור מסמכי Word באמצעות Python.
ערוך או שנה מסמכי Word באמצעות Python
בחלק הקודם, יצרנו מסמך וורד. כעת, בואו נערוך אותו ונשנה את תוכן המסמך. אנו יכולים לערוך מסמכי Word על ידי ביצוע השלבים המפורטים להלן:
- ראשית, טען מסמך Word קיים באמצעות המחלקה Document.
- לאחר מכן, גש למקטע הספציפי לפי האינדקס שלו.
- לאחר מכן, גש לתוכן הפסקה הראשונה כאובייקט של המחלקה Run.
- לאחר מכן, הגדר את הטקסט לעדכון עבור הפסקה שניגשת אליה.
- לבסוף, קרא למתודה save() עם נתיב קובץ הפלט כדי לשמור את הקובץ המעודכן.
דוגמת הקוד הבאה מראה כיצד לערוך מסמך Word (DOCX) באמצעות Python.
import aspose.words as aw
# דוגמה זו מדגימה כיצד לערוך מסמך Word קיים.
# טען את המסמך
doc = aw.Document("C:\\Files\\sample_output.docx")
# אתחול בונה מסמכים
builder = aw.DocumentBuilder(doc)
# גש לפסקה
paragraph = doc.sections[0].body.paragraphs[0].runs[0]
paragraph.text = "This is an updated text!"
# שמור את המסמך
doc.save("C:\\Files\\sample_updated.docx")

ערוך או שנה מסמכי Word באמצעות Python.
מצא והחלף טקסט במסמכי Word באמצעות Python
נוכל גם למצוא כל טקסט ולהחליף אותו בטקסט חדש על ידי ביצוע השלבים המפורטים להלן:
- ראשית, טען מסמך Word באמצעות המחלקה Document.
- לאחר מכן, צור מופע של המחלקה FindReplaceOptions.
- לאחר מכן, קרא למתודה replace(). זה לוקח את מחרוזת החיפוש, את המחרוזת החלפה ואת האובייקט FindReplaceOptions כארגומנטים.
- לבסוף, קרא למתודה save() עם נתיב קובץ הפלט כדי לשמור את הקובץ המעודכן.
דוגמת הקוד הבאה מראה כיצד למצוא ולהחליף טקסט ספציפי במסמך Word (DOCX) באמצעות Python.
import aspose.words as aw
# דוגמה זו מדגימה כיצד למצוא ולהחליף טקסט במסמך Word.
# טען את המסמך
doc = aw.Document("C:\\Files\\sample_output.docx")
# עדכן באמצעות חיפוש והחלפה
# ציין את מחרוזת החיפוש והחלף מחרוזת באמצעות שיטת החלפה.
doc.range.replace("Aspose.Words", "Hello",
aw.replacing.FindReplaceOptions(aw.replacing.FindReplaceDirection.FORWARD))
# שמור את המסמך
doc.save("C:\\Files\\find_and_replace.docx")

מצא והחלף טקסט במסמכי Word.
המר מסמכי Word באמצעות Python
אנו יכולים להמיר מסמכי Word לפורמטים אחרים כגון PDF, XPS, EPUB, HTML, JPG, PNG וכו’. אנא בצע את השלבים המפורטים להלן כדי להמיר מסמך Word לדף אינטרנט HTML:
- ראשית, טען מסמך Word באמצעות המחלקה Document.
- לאחר מכן, צור מופע של המחלקה HtmlSaveOptions עם האובייקט Document כארגומנט.
- לאחר מכן, ציין את המאפיינים cssstylesheettype, exportfontresources, resourcefolder והכינוי.
- לבסוף, קרא למתודה save() עם נתיב קובץ הפלט ואובייקט HtmlSaveOptions כארגומנטים כדי לשמור את קובץ ה-HTML שהומר.
דוגמת הקוד הבאה מראה כיצד להמיר מסמך Word (DOCX) ל-HTML באמצעות Python.
import aspose.words as aw
# דוגמה זו מדגימה כיצד להמיר מסמך Word ל-PDF.
# טען מסמך Word קיים
doc = aw.Document("C:\\Files\\sample_output.docx")
# ציין אפשרויות שמירה
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.css_style_sheet_type = aw.saving.CssStyleSheetType.EXTERNAL
saveOptions.export_font_resources = True
saveOptions.resource_folder = "C:\\Files\\Resources"
saveOptions.resource_folder_alias = "C:/Files/resources"
# שמור את המסמך שהומר
doc.save("C:\\Files\\Converted.html", saveOptions)

באופן דומה, אנו יכולים גם להמיר מסמכי Word לפורמטים נתמכים אחרים. קרא עוד על איך להמיר Word ל-EPUB, Word ל-PDF, מסמך Word ל-Markdown, Word ל-JPG או תמונות PNG בתיעוד .
נתח מסמכי Word באמצעות Python
אנו יכולים לנתח מסמכי Word ולחלץ את התוכן כטקסט רגיל על ידי ביצוע השלבים המפורטים להלן:
- ראשית, טען מסמך Word באמצעות המחלקה Document.
- לאחר מכן, חלץ והדפיס את הטקסט.
- לבסוף, קרא למתודה save() כדי לשמור את מסמך Word כקובץ טקסט. שיטה זו לוקחת את הנתיב של קובץ הפלט כארגומנט.
דוגמת הקוד הבאה מראה כיצד לנתח מסמך Word (DOCX) באמצעות Python.
import aspose.words as aw
# דוגמה זו מדגימה כיצד לנתח מסמך Word.
# טען את המסמך
doc = aw.Document("C:\\Files\\Sample.docx")
# חלץ טקסט
print(doc.range.text)
# שמור כטקסט רגיל
doc.save("C:\\Files\\output.txt")
קבל רישיון חינם
אתה יכול לקבל רישיון זמני בחינם כדי לנסות את הספרייה ללא מגבלות הערכה.
סיכום
במאמר זה למדנו כיצד:
- אוטומציה של MS Word באמצעות Python;
- ליצור ולערוך מסמכי Word באופן תוכנתי;
- לנתח או להמיר קובצי DOCX;
- למצוא ולהחליף טקסט במסמכי Word באמצעות Python.
חוץ מזה, אתה יכול ללמוד עוד על Aspose.Words for Python API באמצעות תיעוד. בכל מקרה של אי בהירות, אנא אל תהסס לפנות אלינו בפורום.