במקרים שונים, עליך לפצל מסמך MS Word למספר מסמכים. לדוגמה, ייתכן שיהיה עליך ליצור מסמך נפרד עבור כל עמוד, מקטע או אוסף של דפים במסמך Word. על מנת להפוך את פיצול המסמכים לאוטומטי, מאמר זה מכסה כיצד לפצל את MS Word DOCX באופן פרוגרמטי באמצעות Java. הסעיפים הבאים מספקים מדריך שלב אחר שלב ודוגמאות קוד של קריטריוני הפיצול שהוזכרו לעיל.
- Java API לפיצול מסמכי Word
- פיצול Word DOCX/DOC באמצעות Java
- השתמש בטווח עמודים כדי לפצל מסמך Word
- פיצול מסמך Word לפי מקטעים
- קבל רישיון API בחינם
Java API לפיצול Word DOCX
Aspose.Words for Java הוא ממשק API רב עוצמה ועשיר בתכונות מניפולציה של מסמכים המאפשר לך ליצור ולעבד מסמכי MS Word. בנוסף לתכונות האוטומציה הבסיסיות והמתקדמות של Word, ה-API מאפשר לך גם לפצל מסמך Word למספר מסמכים. אתה יכול להוריד את ה-API או להתקין אותו בתוך היישום המבוסס על Maven באמצעות התצורות הבאות.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.1</version>
<classifier>jdk17</classifier>
</dependency>
מפצל מסמכי וורד - כיתת עוזר
לפני שתתחיל לפצל את המסמכים, תצטרך להוסיף את מחלקת העזר הבאה לפרויקט שלך המיישמת מפצל מסמכי Java המבוסס על Aspose.Words עבור Java. לאחר שהוספת את הכיתה, תוכל להמשיך לפצל את המסמכים באמצעות דוגמאות הקוד המפורטות בסעיפים למטה.
פיצול Word DOCX באמצעות Java
קודם כל, בואו נסתכל כיצד לפצל מסמך MS Word לפי עמוד. במקרה זה, כל עמוד במסמך המקור יומר למסמך Word נפרד. להלן השלבים לפיצול עמודים של מסמך Word.
- טען את מסמך Word באמצעות המחלקה מסמך.
- צור אובייקט של PageSplitter ואתחול אותו עם האובייקט Document.
- עברו בלולאה בין הדפים במסמך.
- השתמש בשיטת PageSplitter.getDocumentOfPage(Int pageIndex) כדי לאחזר כל עמוד לאובייקט Document.
- שמור את המסמך בשיטת Document.save(String).
דוגמת הקוד הבאה מראה כיצד לפצל מסמך Word באמצעות Java.
// לדוגמאות מלאות וקובצי נתונים, נא עבור אל https://github.com/aspose-words/Aspose.Words-for-Java
// פתח מסמך וורד
Document doc = new Document("Word.docx");
// פיצול צמתים במסמך לדפים נפרדים
DocumentPageSplitter splitter = new DocumentPageSplitter(doc);
// שמור כל עמוד כמסמך נפרד
for (int page = 1; page <= doc.getPageCount(); page++)
{
Document pageDoc = splitter.getDocumentOfPage(page);
pageDoc.save("SplitDocumentByPage_" + page + ".docx");
}
השתמש בטווח עמודים כדי לפצל את Word DOCX ב-Java
אתה יכול גם להגדיר טווח עמודים שברצונך לפצל ממסמך המקור של Word. להלן השלבים לביצוע פעולה זו.
- טען את מסמך Word באמצעות המחלקה מסמך.
- צור אובייקט של PageSplitter ואתחול אותו עם האובייקט Document.
- השתמש בשיטה PageSplitter.getDocumentOfPageRange(Int, Int) כדי לאחזר אוסף של דפים לאובייקט Document.
- שמור את המסמך בשיטת Document.save(String).
דוגמת הקוד הבאה מראה כיצד לפצל מסמך Word לפי טווח עמודים באמצעות Java.
// לדוגמאות מלאות וקובצי נתונים, נא עבור אל https://github.com/aspose-words/Aspose.Words-for-Java
// פתח מסמך וורד
Document doc = new Document("Word.docx");
// פיצול צמתים במסמך לדפים נפרדים
DocumentPageSplitter splitter = new DocumentPageSplitter(doc);
// קבל חלק מהמסמך
Document pageDoc = splitter.getDocumentOfPageRange(3,6);
pageDoc.save("SplitDocumentByPageRange.docx");
פיצול מסמך Word לפי מקטעים באמצעות Java
Aspose.Words עבור Java מאפשר לך גם לפצל מסמך Word לפי מעברי סעיפים. להלן השלבים לביצוע פעולה זו.
- טען את מסמך Word באמצעות המחלקה מסמך.
- עברו בלולאה בכל חלק של המסמך באמצעות שיטת Document.getSections().
- לשכפל מקטע לאובייקט Section באמצעות שיטת Document.getSections().get(index).deepClone().
- צור מסמך חדש והוסף מקטע משובט למסמך באמצעות שיטת Document.getSections().add(Section).
- שמור את המסמך בשיטת Document.save(String).
דוגמת הקוד הבאה מראה כיצד לפצל מסמך Word לפי מקטעים באמצעות Java.
// טען מסמך Word DOCX
Document doc = new Document("word.docx");
for (int i = 0; i < doc.getSections().getCount(); i++) {
// פצל מסמך לחלקים קטנים יותר, במקרה זה מפוצל לפי סעיף
Section section = doc.getSections().get(i).deepClone();
// צור מסמך חדש
Document newDoc = new Document();
newDoc.getSections().clear();
// הוסף סעיף
Section newSection = (Section) newDoc.importNode(section, true);
newDoc.getSections().add(newSection);
// שמור כל חלק כמסמך נפרד
newDoc.save("splitted_" + i + ".docx");
}
קבל רישיון API בחינם
אתה יכול לקבל רישיון זמני בחינם כדי לנסות את ה-API ללא מגבלות הערכה.
סיכום
במאמר זה, למדת כיצד לפצל את MS Word DOCX/DOC באמצעות Java. המדריך צעד אחר צעד ודוגמאות קוד הראו כיצד לפצל מסמך Word לפי מקטעים, עמודים או טווח של עמודים. אתה יכול לחקור יותר על Java Word API באמצעות תיעוד.