פיצול מסמכים ב-Java

פירוק מסמכים הוא עבודה חשובה בטיפול במידע ובהתמודדות עם נתונים. המשמעות היא חלוקת טקסטים או קבצים ארוכים לחלקים קטנים יותר שקל יותר לנהל אותם. בדרך כלל, אנשים מחלקים מסמכים לפי כל עמוד או קבוצה של עמודים. בין אם יש לך הרבה מאמרי מחקר, דוחות ארוכים או סטים של נתונים, פיצול מסמכים עוזר לשמור על הסדר. מאמר זה יציג בפניכם קבוצה שימושית של כלים לפיצול מסמכים ב-Java. בדרך זו, תוכל לפצל מסמכים בפורמטים של Word, PDF, Excel ו-PowerPoint.

ממשקי API של Java לפיצול מסמכים

Aspose היא חברה מובילה המציעה ממשקי API כדי לסייע בפיצול מסמכים לחלקים קטנים יותר במהירות ובדייקנות. בין אם אתה עובד עם קבצי טקסט, גיליונות אלקטרוניים או מצגות PPT, ממשקי ה-API של Aspose הופכים את משימות פיצול המסמכים לקלות יותר למתכנתים. הבה נחקור את ספריות פיצול המסמכים הללו ונראה כיצד לפצל סוגים שונים של מסמכים ב-Java.

פיצול מסמכי PDF ב-Java

פיצול PDF של Java

פורמט המסמכים הניידים (PDF) הוא פורמט מועדף להדפסה ושיתוף של מסמכים. הפריסה העקבית שלו על פני פלטפורמות שונות הופכת אותו לפתרון מומלץ לשיתוף מסמכים. אם אתה רוצה לפצל קובצי PDF ב-Java, Aspose מציעה Aspose.PDF for Java.

Aspose.PDF עבור Java מקל על הדרך לפיצול מסמכי PDF ומאפשר לך להתאים אישית את קריטריוני הפיצול לפי הדרישות שלך. להלן השלבים שאתה יכול לבצע כדי לפצל PDF ב-Java.

  • התקן את Aspose.PDF עבור Java.
  • טען את מסמך ה-PDF באמצעות מחלקת Document.
  • עברו בלולאה בין הדפים באמצעות Document.getPages() וגשו לכל עמוד באמצעות מחלקת Page.
  • בכל איטרציה, צור מסמך חדש, הוסף את העמוד הנוכחי למסמך ושמור אותו כקובץ PDF בשיטת Document.save(String).

דוגמת הקוד הבאה מדגימה פיצול מסמכי PDF ב-Java.

// פתח את המסמך
Document pdfDocument = new Document("input.pdf");

// עבור מונה דפים
int pageCount = 1;

// עברו בלולאה בכל הדפים
for (Page pdfPage : pdfDocument.getPages()) {
	// צור מסמך חדש
	Document newDocument = new Document();

	// הוסף עמוד למסמך
	newDocument.getPages().add(pdfPage);

	// שמור כ-PDF
	newDocument.save("page_" + pageCount + "_out" + ".pdf");
	pageCount++;
}

קרא מאמר שלם על פיצול מסמכי PDF באמצעות Java.

התחל עם Java PDF לעיבוד מסמכי API באמצעות המשאבים המפורטים להלן:

פיצול מסמכי Word ב-Java

פיצול מילים של Java

Microsoft Word היא כעת אפליקציה בשימוש נרחב להפקת מסמכי טקסט, כולל דוחות, חוזים, קורות חיים וצורות תוכן אחרות. קבצים אלה מאוחסנים בדרך כלל בפורמטים DOC ו- DOCX. כדי לפצל מסמכי Microsoft Word, אתה יכול להשתמש ב-Aspose.Words for Java שסופק על ידי Aspose.

Aspose.Words עבור Java עומדת כממשק API חזק לעיבוד תמלילים הכולל מגוון של יכולות להפקה ולמניפולציה של מסמכי Word. ה-API מספק דרך חלקה ומדויקת לפיצול מסמכי Word. בואו נעמיק בתהליך של פיצול מסמך Word באמצעות Java על ידי מינוף היכולות של Aspose.Words עבור Java.

  • התקן את Aspose.Words עבור Java.
  • טען את מסמך Word באמצעות מחלקה Document.
  • צור אובייקט של המחלקה DocumentPageSplitter ואתחול אותו עם האובייקט Document.
  • חזור על דפי המסמך.
  • חלץ כל עמוד לאובייקט Document חדש באמצעות שיטת DocumentPageSplitter.getDocumentOfPage(int PageIndex).
  • שמור כל מסמך בשיטת Document.save(String).

דגימת הקוד של Java להלן מדגימה פיצול מסמכי Word.

// לדוגמאות מלאות וקובצי נתונים, נא עבור אל https://github.com/aspose-words/Aspose.Words-for-Java
// פתח מסמך וורד
Document doc = new Document("Word.docx");

// פיצול צמתים במסמך לדפים נפרדים
DocumentPageSplitter splitter = new DocumentPageSplitter(doc);

// שמור כל עמוד כמסמך נפרד
for (int page = 1; page <= doc.getPageCount(); page++)
{
    Document pageDoc = splitter.getDocumentOfPage(page);
    pageDoc.save("SplitDocumentByPage_" + page + ".docx");
}

קרא מאמר שלם על פיצול מסמכי Word באמצעות Java.

אתה יכול להתחיל עם Java Word פיצול מסמכי API באמצעות המשאבים המפורטים להלן.

פיצול גיליונות אלקטרוניים של Excel ב-Java

פיצול גיליונות אלקטרוניים של Java

MS Excel הוא כלי רב עוצמה המאפשר לך לשמור, לארגן ולנהל נתונים בגיליונות עבודה וחוברות עבודה. אתה יכול להשתמש במגוון תכונות שמספק MS Excel כדי לעבד את הנתונים, ליצור ייצוגים חזותיים, לבצע פעולות מספריות ועוד הרבה יותר. עבור פיצול גיליונות אלקטרוניים ב-Java, Aspose מספקת Aspose.Cells for Java.

בדיוק כמו ממשקי ה-API שהוזכרו קודם לכן, Aspose.Cells עבור Java גם עוזר לך לפצל בקלות גליונות עבודה מחוברת עבודה ולשמור אותם כקבצים נפרדים. פשוט פתח את חוברת העבודה של Excel שאתה רוצה, פצל אותה לגיליונות האלקטרוניים החדשים, והנה - פיצול גיליונות אקסל ב-Java נעשה!

  • התקן את Aspose.Cells עבור Java.
  • טען את קובץ ה-Excel באמצעות מחלקה Workbook.
  • צור אובייקט חדש של חוברת עבודה.
  • העתק את הגיליון מחוברת העבודה של המקור לחוברת העבודה החדשה שנוצרה.
  • שמור את חוברת העבודה החדשה באמצעות שיטת Workbook.save().

דגימת הקוד שלהלן מדגימה כיצד לפצל גיליון אלקטרוני של Excel ב-Java.

// טען את חוברת העבודה של המקור של Excel
Workbook source = new Workbook("source.xls");

// צור חוברת עבודה חדשה של Excel
Workbook destination = new Workbook();

// העתק את הגיליון הראשון של חוברת העבודה של המקור לחוברת העבודה השנייה
destination.getWorksheets().get(0).copy(source.getWorksheets().get(0));

// שמור את הקובץ.
destination.save("splitted.xls", FileFormatType.EXCEL_97_TO_2003);

חקור את API לעיבוד גיליונות אלקטרוניים של Java באמצעות המשאבים המפורטים להלן:

פיצול PPT של Java PowerPoint

פיצול Java PowerPoint

כדי לפצל מצגות PowerPoint PPT, אתה יכול להשתמש ב-Aspose.Slides עבור Java. זהו API חזק של Java ליצירה, שינוי והמרה של מצגות PowerPoint כמו PPT, PPTX, PPS, POT ו-ODP. Aspose.Slides עבור Java היא בחירה מועדפת עבור מפתחי Java לעבודה עם מצגות PowerPoint ביישומים שונים.

אז בואו נסתכל כיצד לפצל PowerPoint PPT ב-Java באמצעות Aspose.Slides עבור Java.

  • התקן את Aspose.Slides עבור Java.
  • ראשית, צור מופע של מחלקת Presentation כדי לטעון את מצגת PowerPoint.
  • לאחר מכן, בצע לולאה דרך כל ISlide באמצעות שיטת Presentation.getSlides()‎.
  • בכל איטרציה, בצע את השלבים הבאים:
    • צור מופע של המחלקה Presentation.
    • הסר את שקופית ברירת המחדל מהמצגת.
    • הוסף את השקופית למצגת באמצעות שיטת Presentation.getSlides().addClone(ISlide).
    • לבסוף, שמור את המצגת באמצעות שיטת Presentation.save(String, SaveFormat).

דגימת הקוד הבאה מראה כיצד לפצל PowerPoint PPT ב-Java:

// טען מצגת PowerPoint
Presentation presentation = new Presentation("presentation.pptx");

// עברו דרך השקופיות במצגת
for (ISlide sld : presentation.getSlides()) {
	// צור מצגת חדשה
	Presentation newPres = new Presentation();
	
	// הסר שקף ברירת מחדל
	newPres.getSlides().get_Item(0).remove();
	
	// הוסף שקופית למצגת
	newPres.getSlides().addClone(sld);
               
	// שמור מצגת
	newPres.save(String.format("Slide_{0}.pptx", sld.getSlideNumber()), SaveFormat.Pptx);
}

קרא את המאמר המלא על כיצד לפצל מצגות PPT ב-Java:

להלן כמה משאבים שימושיים כדי לחקור עוד על Java PowerPoint עיבוד API.

קבל רישיון חינם

קבל את [הרשיון החינמי] שלך 4 ובצע פיצול מסמכים ללא מגבלות הערכה.

סיכום

אנשים משתמשים לעתים קרובות בפיצול מסמכים כאשר הם צריכים להפוך מסמכים גדולים לקטנים יותר. זה מקל על הטיפול והעבודה עם מסמכים שיש להם פחות עמודים או מקטעים. במדריך זה, הראנו לך כיצד לפצל סוגים שונים של מסמכים ב-Java. הסברנו כיצד לפצל קובצי PDF, קובצי Word, מצגות PowerPoint וגיליונות אלקטרוניים של Excel באמצעות דוגמאות קוד. אתה יכול בקלות להוסיף את ממשקי ה-API המסופקים ליישומי Java שלך ולפצל מסמכים בצורה חלקה.