การแยกเอกสารในภาษาจาวา

การแยกเอกสารเป็นงานที่สำคัญในการจัดการข้อมูลและจัดการกับข้อมูล ซึ่งหมายถึงการแบ่งข้อความหรือไฟล์ยาวๆ ออกเป็นส่วนย่อยๆ ที่ง่ายต่อการจัดการ โดยปกติแล้ว ผู้คนจะแบ่งเอกสารตามแต่ละหน้าหรือชุดของหน้า ไม่ว่าคุณจะมีงานวิจัยจำนวนมาก รายงานยาว ๆ หรือชุดข้อมูล การแยกเอกสารจะช่วยให้สิ่งต่าง ๆ เป็นระเบียบ บทความนี้จะแนะนำชุดเครื่องมือที่เป็นประโยชน์ในการแยกเอกสารใน Java ด้วยวิธีนี้ คุณจะสามารถแยกเอกสารที่อยู่ในรูปแบบ Word, PDF, Excel และ PowerPoint

Java APIs เพื่อแยกเอกสาร

Aspose เป็นบริษัทชั้นนำที่ให้บริการ API เพื่อช่วยแยกเอกสารออกเป็นส่วนย่อยๆ อย่างรวดเร็วและแม่นยำ ไม่ว่าคุณจะทำงานกับไฟล์ข้อความ สเปรดชีต หรืองานนำเสนอ PPT API ของ Aspose ช่วยให้การแยกเอกสารง่ายขึ้นสำหรับโปรแกรมเมอร์ ลองสำรวจไลบรารีการแยกเอกสารเหล่านี้และดูวิธีแยกเอกสารประเภทต่างๆ ใน Java

การแยกเอกสาร PDF ใน Java

การแยก Java PDF

รูปแบบเอกสารแบบพกพา (PDF) เป็นรูปแบบที่ต้องการสำหรับการพิมพ์และแบ่งปันเอกสาร เลย์เอาต์ที่สอดคล้องกันในแพลตฟอร์มต่างๆ ทำให้เป็นโซลูชันสำหรับการแชร์เอกสาร หากต้องการแยก PDF ใน Java Aspose มี Aspose.PDF for Java

Aspose.PDF for Java ช่วยลดขั้นตอนการแยกเอกสาร PDF และให้คุณปรับแต่งเกณฑ์การแยกตามความต้องการของคุณ ด้านล่างนี้เป็นขั้นตอนที่คุณสามารถปฏิบัติตามเพื่อแยก PDF ใน Java

  • ติดตั้ง Aspose.PDF for Java
  • โหลดเอกสาร PDF โดยใช้คลาส Document
  • วนซ้ำหน้าโดยใช้ Document.getPages() และเข้าถึงแต่ละหน้าโดยใช้คลาสหน้า
  • ในการวนซ้ำทุกครั้ง ให้สร้างเอกสารใหม่ เพิ่มหน้าปัจจุบันลงในเอกสาร และบันทึกเป็นไฟล์ PDF โดยใช้วิธี Document.save(String)

ตัวอย่างโค้ดต่อไปนี้สาธิตการแยกเอกสาร PDF ใน Java

// เปิดเอกสาร
Document pdfDocument = new Document("input.pdf");

// สำหรับตัวนับหน้า
int pageCount = 1;

// วนซ้ำทุกหน้า
for (Page pdfPage : pdfDocument.getPages()) {
	// สร้างเอกสารใหม่
	Document newDocument = new Document();

	// เพิ่มหน้าในเอกสาร
	newDocument.getPages().add(pdfPage);

	// บันทึกเป็น PDF
	newDocument.save("page_" + pageCount + "_out" + ".pdf");
	pageCount++;
}

อ่านบทความฉบับสมบูรณ์เกี่ยวกับ การแยกเอกสาร PDF โดยใช้ Java

เริ่มต้นใช้งาน API การประมวลผลเอกสาร Java PDF โดยใช้แหล่งข้อมูลด้านล่าง:

การแยกเอกสาร Word ใน Java

การแยกคำ Java

ปัจจุบัน Microsoft Word เป็นแอปพลิเคชันที่ใช้กันอย่างแพร่หลายสำหรับการผลิตเอกสารข้อความ รวมถึงรายงาน สัญญา ประวัติย่อ และเนื้อหาในรูปแบบอื่นๆ ไฟล์เหล่านี้มักจัดเก็บในรูปแบบ DOC และ DOCX หากต้องการแยกเอกสาร Microsoft Word คุณสามารถใช้ Aspose.Words for Java ที่ Aspose จัดเตรียมไว้ให้

Aspose.Words for Java หมายถึง API การประมวลผลคำที่มีประสิทธิภาพซึ่งครอบคลุมความสามารถที่หลากหลายสำหรับการสร้างและจัดการเอกสาร Word API มอบวิธีการแยกเอกสาร Word ที่ราบรื่นและแม่นยำ เรามาเจาะลึกขั้นตอนการแยกเอกสาร Word โดยใช้ Java โดยใช้ประโยชน์จากความสามารถของ Aspose.Words for Java

  • ติดตั้ง Aspose.Words for Java
  • โหลดเอกสาร Word โดยใช้คลาส Document
  • สร้างวัตถุของคลาส DocumentPageSplitter และเริ่มต้นด้วยวัตถุเอกสาร
  • ทำซ้ำผ่านหน้าเอกสาร
  • แยกแต่ละหน้าลงในวัตถุเอกสารใหม่โดยใช้เมธอด DocumentPageSplitter.getDocumentOfPage(int PageIndex)
  • บันทึกแต่ละเอกสารโดยใช้เมธอด Document.save(String)

ตัวอย่างโค้ด Java ด้านล่างแสดงการแยกเอกสาร Word

// สำหรับตัวอย่างและไฟล์ข้อมูลทั้งหมด โปรดไปที่ https://github.com/aspose-words/Aspose.Words-for-Java
// เปิดเอกสาร Word
Document doc = new Document("Word.docx");

// แยกโหนดในเอกสารออกเป็นหน้าต่างๆ
DocumentPageSplitter splitter = new DocumentPageSplitter(doc);

// บันทึกแต่ละหน้าเป็นเอกสารแยกต่างหาก
for (int page = 1; page <= doc.getPageCount(); page++)
{
    Document pageDoc = splitter.getDocumentOfPage(page);
    pageDoc.save("SplitDocumentByPage_" + page + ".docx");
}

อ่านบทความฉบับสมบูรณ์เกี่ยวกับ การแยกเอกสาร Word โดยใช้ Java

คุณสามารถเริ่มต้นด้วย API การแยกเอกสาร Java Word โดยใช้ทรัพยากรที่ระบุด้านล่าง

การแยกสเปรดชีต Excel ใน Java

การแบ่งสเปรดชีต Java

MS Excel เป็นเครื่องมืออันทรงพลังที่ช่วยให้คุณจัดเก็บ จัดระเบียบ และจัดการข้อมูลในแผ่นงานและสมุดงาน คุณสามารถใช้คุณลักษณะต่างๆ ที่มีให้โดย MS Excel เพื่อประมวลผลข้อมูล สร้างการแสดงภาพ ดำเนินการทางตัวเลข และอื่นๆ อีกมากมาย สำหรับการแยกสเปรดชีตใน Java Aspose มี Aspose.Cells for Java

เช่นเดียวกับ API ที่กล่าวถึงก่อนหน้านี้ Aspose.Cells for Java ยังช่วยให้คุณแยกแผ่นงานออกจากสมุดงานและบันทึกเป็นไฟล์แยกกันได้อย่างง่ายดาย เพียงเปิดสมุดงาน Excel ที่คุณต้องการ แบ่งเป็นสเปรดชีตใหม่ เท่านี้คุณก็จะได้ - การแยกสเปรดชีต Excel ใน Java เสร็จแล้ว!

  • ติดตั้ง Aspose.Cells for Java
  • โหลดไฟล์ Excel โดยใช้คลาสสมุดงาน
  • สร้างวัตถุสมุดงานใหม่
  • คัดลอกแผ่นงานจากสมุดงานต้นทางไปยังสมุดงานที่สร้างขึ้นใหม่
  • บันทึกสมุดงานใหม่โดยใช้เมธอด Workbook.save()

ตัวอย่างโค้ดด้านล่างแสดงวิธีแยกสเปรดชีต Excel ใน Java

// โหลดสมุดงาน Excel ต้นทาง
Workbook source = new Workbook("source.xls");

// สร้างสมุดงาน Excel ใหม่
Workbook destination = new Workbook();

// คัดลอกแผ่นงานแรกของสมุดงานต้นฉบับลงในสมุดงานที่สอง
destination.getWorksheets().get(0).copy(source.getWorksheets().get(0));

// บันทึกไฟล์
destination.save("splitted.xls", FileFormatType.EXCEL_97_TO_2003);

สำรวจ API การประมวลผลสเปรดชีต Java โดยใช้แหล่งข้อมูลด้านล่าง:

การแยก Java PowerPoint PPT

การแยก Java PowerPoint

หากต้องการแยกงานนำเสนอ PowerPoint PPT คุณสามารถใช้ Aspose.Slides for Java เป็น Java API ที่มีประสิทธิภาพสำหรับการสร้าง แก้ไข และแปลงงานนำเสนอ PowerPoint เช่น PPT, PPTX, PPS, POT และ ODP Aspose.Slides for Java เป็นตัวเลือกยอดนิยมสำหรับนักพัฒนา Java เพื่อทำงานกับงานนำเสนอ PowerPoint ในแอปพลิเคชันต่างๆ

มาดูวิธีแยก PowerPoint PPT ใน Java โดยใช้ Aspose.Slides for Java

  • ติดตั้ง Aposose.Slides สำหรับ Java
  • ขั้นแรก สร้างอินสแตนซ์ของคลาสการนำเสนอเพื่อโหลดงานนำเสนอ PowerPoint
  • จากนั้นวนซ้ำแต่ละ ISlide โดยใช้เมธอด Presentation.getSlides()
  • ในการวนซ้ำแต่ละครั้ง ให้ทำตามขั้นตอนต่อไปนี้:
    • สร้างอินสแตนซ์ของคลาสงานนำเสนอ
    • ลบสไลด์เริ่มต้นออกจากงานนำเสนอ
    • เพิ่มสไลด์ลงในงานนำเสนอโดยใช้เมธอด Presentation.getSlides().addClone(ISlide)
    • สุดท้าย บันทึกงานนำเสนอโดยใช้เมธอด Presentation.save(String, SaveFormat)

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแยก PowerPoint PPT ใน Java:

// โหลดงานนำเสนอ PowerPoint
Presentation presentation = new Presentation("presentation.pptx");

// ทำซ้ำผ่านสไลด์ในงานนำเสนอ
for (ISlide sld : presentation.getSlides()) {
	// สร้างงานนำเสนอใหม่
	Presentation newPres = new Presentation();
	
	// ลบสไลด์เริ่มต้น
	newPres.getSlides().get_Item(0).remove();
	
	// เพิ่มสไลด์ในงานนำเสนอ
	newPres.getSlides().addClone(sld);
               
	// บันทึกงานนำเสนอ
	newPres.save(String.format("Slide_{0}.pptx", sld.getSlideNumber()), SaveFormat.Pptx);
}

อ่านบทความฉบับเต็มเกี่ยวกับ วิธีแยกงานนำเสนอ PPT ใน Java:

ด้านล่างนี้เป็นแหล่งข้อมูลที่เป็นประโยชน์ในการสำรวจเพิ่มเติมเกี่ยวกับ API การประมวลผลของ Java PowerPoint

รับใบอนุญาตฟรี

รับ ใบอนุญาตฟรี และดำเนินการแยกเอกสารโดยไม่มีข้อจำกัดในการประเมิน

สรุป

ผู้คนมักจะใช้การแยกเอกสารเมื่อต้องการแปลงเอกสารขนาดใหญ่ให้มีขนาดเล็กลง ทำให้ง่ายต่อการจัดการและทำงานกับเอกสารที่มีหน้าหรือส่วนน้อยลง ในคู่มือนี้ เราได้แสดงวิธีแยกเอกสารประเภทต่างๆ ใน Java เราได้อธิบายวิธีแยกไฟล์ PDF, ไฟล์ Word, งานนำเสนอ PowerPoint และสเปรดชีต Excel โดยใช้ตัวอย่างโค้ด คุณสามารถเพิ่ม API ที่ให้ไว้ในแอปพลิเคชัน Java และแยกเอกสารได้อย่างราบรื่น