การแยกเอกสารใน C#

การแยกเอกสารเป็นงานพื้นฐานในการจัดการข้อมูลและการประมวลผลข้อมูล มันเกี่ยวข้องกับการแบ่งเชิงกลยุทธ์ของข้อความหรือไฟล์ที่มีความยาวออกเป็นส่วนที่เล็กลงและสามารถจัดการได้มากขึ้น โดยทั่วไป เอกสารจะถูกแบ่งตามแต่ละหน้าหรือช่วงของหน้า ไม่ว่าจะเป็นการจัดการกับเอกสารการวิจัยจำนวนมาก รายงานจำนวนมาก หรือชุดข้อมูล กระบวนการแยกเอกสารจะช่วยให้องค์กรมีประสิทธิภาพ บทความนี้จะแนะนำคุณให้รู้จักกับคอลเลกชั่นสุดยอดของ API เพื่อแยกเอกสารโดยทางโปรแกรมใน C# ดังนั้น คุณจะสามารถแยกเอกสารในรูปแบบ Word, PDF, Excel และ PowerPoint

C# APIs เพื่อแยกเอกสาร

Aspose คือผู้ให้บริการชั้นนำด้าน API ที่มีประสิทธิภาพและหลากหลาย ซึ่งออกแบบมาเพื่อปรับปรุงกระบวนการแยกเอกสารให้มีประสิทธิภาพและแม่นยำ ในโลกที่การจัดการและจัดการไฟล์ขนาดใหญ่และซับซ้อนเป็นงานที่ซับซ้อน API ที่ล้ำสมัยของ Aspose นำเสนอโซลูชันที่ทรงพลัง ไม่ว่าจะจัดการกับเอกสารข้อความ สเปรดชีต หรืองานนำเสนอที่ครอบคลุม API ของ Aspose ช่วยให้นักพัฒนาสามารถแบ่งเอกสารเหล่านี้ออกเป็นส่วนประกอบที่เล็กลงและสามารถจัดการได้มากขึ้นได้อย่างง่ายดาย มาดู API การแยกเอกสารของ Aspose ที่เพิ่มประสิทธิภาพการจัดการเอกสารในอุตสาหกรรมและแอปพลิเคชันต่างๆ

การแยกเอกสาร PDF ใน C#

การแยก C # PDF

Portable Document Format (PDF) เป็นรูปแบบที่แพร่หลายซึ่งมีชุดฟังก์ชันการทำงานที่หลากหลายและความสามารถในการรักษารูปแบบที่สอดคล้องกันในระบบต่างๆ PDF กลายเป็นตัวเลือกที่ต้องการสำหรับการแบ่งปันและการพิมพ์เอกสารเหมือนกัน ตั้งแต่เอกสารขนาดเล็กไปจนถึงรายงานขนาดใหญ่ PDF ถูกเลือกใช้เป็นรูปแบบเอกสารหลัก สำหรับการแยก PDF ใน C# Aspose มี Aspose.PDF for .NET

Aspose.PDF for .NET ทำให้กระบวนการแยก PDF ง่ายขึ้น และให้วิธีการแยกเอกสาร PDF ที่ยืดหยุ่นแก่คุณ คุณสามารถปรับแต่งวิธีการตามความต้องการของคุณ ด้านล่างนี้เป็นขั้นตอนที่คุณสามารถปฏิบัติตามเพื่อแยก PDF ใน C#

  • ติดตั้ง Aspose.PDF for .NET
  • โหลดเอกสาร PDF โดยใช้คลาส Document
  • วนซ้ำชุด Document.Pages เพื่อเข้าถึงแต่ละหน้าโดยใช้คลาส Page
  • ในการวนซ้ำทุกครั้ง ให้สร้างเอกสารใหม่ เพิ่มหน้าปัจจุบันลงในเอกสารและบันทึกเป็นไฟล์ PDF โดยใช้วิธี Document.Save(String)

ตัวอย่างโค้ดต่อไปนี้แสดงการแยกเอกสาร PDF ใน C#

// เปิดเอกสาร
Document pdfDocument = new Document("merged.pdf");

// สำหรับตัวนับหน้า
int pageCount = 1;

// วนซ้ำทุกหน้า
foreach (Aspose.Pdf.Page pdfPage in pdfDocument.Pages)
{
  	// สร้างเอกสารใหม่
	Document newDocument = new Document();
  
  	// เพิ่มหน้าในเอกสาร
	newDocument.Pages.Add(pdfPage);
  
  	// บันทึกเป็น PDF 
	newDocument.Save("page_" + pageCount + "_out" + ".pdf");
	pageCount++;
}

อ่านบทความฉบับสมบูรณ์เกี่ยวกับ การแยกเอกสาร PDF โดยใช้ C#

เริ่มต้นใช้งาน API การประมวลผลเอกสาร C# PDF โดยใช้แหล่งข้อมูลด้านล่าง:

การแยกเอกสาร Word ใน C#

C# การแยกคำ

Microsoft Word ได้กลายเป็นเครื่องมือที่ต้องการและใช้กันอย่างแพร่หลายสำหรับการสร้างเอกสารข้อความที่หลากหลาย รวมถึงรายงาน สัญญา ประวัติย่อ และอื่นๆ อีกมากมาย ไฟล์เหล่านี้มักจะบันทึกในรูปแบบ DOC/DOCX สำหรับการแยกเอกสาร MS Word นั้น Aspose มี Aspose.Words for .NET

Aspose.Words for .NET เป็นไลบรารีประมวลผลคำที่มีประสิทธิภาพพร้อมฟีเจอร์มากมายสำหรับสร้างและจัดการเอกสาร Word ด้วยเครื่องมือประมวลผลเอกสารที่มีประสิทธิภาพ API ช่วยให้คุณสามารถแยกเอกสาร Word ได้อย่างง่ายดายและมีความแม่นยำสูง มาดูวิธีแยกเอกสาร Word ใน C# โดยใช้ Aspose.Words for .NET

  • ติดตั้ง Aspose.Words for .NET
  • โหลดเอกสาร Word โดยใช้คลาส Document
  • สร้างวัตถุของคลาส DocumentPageSplitter และเริ่มต้นด้วยวัตถุเอกสาร
  • ทำซ้ำผ่านหน้าเอกสาร
  • แยกแต่ละหน้าลงในวัตถุเอกสารใหม่โดยใช้เมธอด DocumentPageSplitter.GetDocumentOfPage(int PageIndex)
  • บันทึกแต่ละเอกสารโดยใช้เมธอด Document.Save(String)

ตัวอย่างโค้ด C# ด้านล่างแสดงการแยกเอกสาร Word

// เปิดเอกสาร Word
Document doc = new Document("Document.docx");

// สร้างและเริ่มต้นตัวแยกหน้าเอกสาร
DocumentPageSplitter splitter = new DocumentPageSplitter(doc);

// บันทึกแต่ละหน้าเป็นเอกสารแยกต่างหาก
for (int page = 1; page <= doc.PageCount; page++)
{
	Document pageDoc = splitter.GetDocumentOfPage(page);
	pageDoc.Save($"spliteed_{page}.docx");
}

อ่านบทความฉบับสมบูรณ์เกี่ยวกับ การแยกเอกสาร Word โดยใช้ C#

คุณสามารถเริ่มต้นด้วย API การแยกเอกสาร C# Word โดยใช้ทรัพยากรที่ระบุด้านล่าง

การแยกสเปรดชีตของ Excel ใน C#

การแยกสเปรดชีต C #

MS Excel อีกหนึ่งแอปพลิเคชันยอดนิยมของ MS Office ช่วยให้คุณจัดระเบียบและจัดการข้อมูลแบบตารางในรูปแบบของเวิร์กชีตและสมุดงาน นอกจากนี้ ยังมีคุณสมบัติที่หลากหลายในการประมวลผลข้อมูล สร้างการแสดงภาพ การดำเนินการทางตัวเลข และอื่นๆ อีกมากมาย สำหรับการแยกสเปรดชีตใน C# นั้น Aspose จะมี Aspose.Cells for .NET

คล้ายกับ API ที่กล่าวถึงข้างต้น Aspose.Cells for .NET ยังช่วยให้คุณแยกแผ่นงานออกจากสมุดงานและบันทึกเป็นไฟล์แยกกันได้ค่อนข้างง่าย คุณจะต้องเข้าถึงแผ่นงานที่ต้องการและแยกออกเป็นเอกสารสเปรดชีตใหม่ เรามาแยกสเปรดชีต Excel ในภาษา C# กัน

  • ติดตั้ง Aspose.Cells for .NET
  • โหลดไฟล์ Excel โดยใช้คลาสสมุดงาน
  • สร้างวัตถุสมุดงานใหม่
  • คัดลอกแผ่นงานจากสมุดงานต้นทางไปยังสมุดงานที่สร้างขึ้นใหม่
  • บันทึกสมุดงานใหม่โดยใช้วิธีการ Workbook.Save()

ตัวอย่างโค้ดด้านล่างแสดงวิธีแยกสเปรดชีต Excel ใน C#

// ไฟล์ Excel แบบโอเพ่นซอร์ส
Workbook sourceWorkbook = new Workbook("source.xlsx");

// เปิดไฟล์ Excel ปลายทาง
Workbook newWorkbook = new Workbook();

// คัดลอกแผ่นงานแรกของสมุดงานต้นทางไปยังสมุดงานปลายทาง
newWorkbook.Worksheets[0].Copy(sourceWorkbook.Worksheets[0]);

// บันทึกไฟล์ Excel
newWorkbook.Save("new-worksheets.xlsx");

สำรวจ API การประมวลผลสเปรดชีต C# โดยใช้แหล่งข้อมูลด้านล่าง:

การแยก C# PowerPoint PPT

การแยก C# PowerPoint

สำหรับการแยกงานนำเสนอ PowerPoint PPT นั้น Aspose มี Aspose.Slides for .NET ซึ่งเป็น C# API ที่มีประสิทธิภาพในการสร้าง แก้ไข และแปลงงานนำเสนอ PowerPoint รวมถึง PPT, PPTX , ปชส. , ปทส. และ อปพร. Aspose.Slides for .NET เป็นโซลูชันแบบ go-to สำหรับนักพัฒนา C# ในการประมวลผลงานนำเสนอ PowerPoint ภายในแอปพลิเคชันที่หลากหลาย

มาดูวิธีแยก PowerPoint PPT ใน C# โดยใช้ Aspose.Slides for .NET

  • ติดตั้ง Aposose.Slides สำหรับ .NET
  • ขั้นแรก สร้างอินสแตนซ์ของคลาสการนำเสนอเพื่อโหลดงานนำเสนอ PowerPoint
  • จากนั้น วนซ้ำแต่ละ ISlide ในคอลเลกชัน Presentation.Slides
  • ในการวนซ้ำแต่ละครั้ง ให้ทำตามขั้นตอนต่อไปนี้:
    • สร้างตัวอย่างของคลาสการนำเสนอ
    • ลบสไลด์เริ่มต้นโดยใช้วิธีการ Presentation.Slides[0].Remove()
    • เพิ่มสไลด์ลงในงานนำเสนอโดยใช้เมธอด Presentation.Slides.AddClone(ISlide)
    • สุดท้าย บันทึกงานนำเสนอโดยใช้เมธอด Presentation.Save(String, SaveFormat)

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแยก PowerPoint PPT ใน C#:

// โหลดงานนำเสนอ PowerPoint
using (Presentation pres = new Presentation("presentation.pptx"))
{
    // วนซ้ำผ่านสไลด์
    foreach(ISlide slide in pres.Slides)
    {
        // สร้างงานนำเสนอใหม่ที่ว่างเปล่า
        using (Presentation newPres = new Presentation())
        {
            // ลบสไลด์เริ่มต้น
            newPres.Slides[0].Remove();

            // เพิ่มสไลด์ในงานนำเสนอ
            newPres.Slides.AddClone(slide);
                       
            // บันทึกงานนำเสนอ
            newPres.Save(string.Format("Slide_{0}.pptx", slide.SlideNumber), SaveFormat.Pptx);
        }
    }
}

อ่านบทความฉบับเต็มเกี่ยวกับ วิธีแยกงานนำเสนอ PPT ใน C#:

ด้านล่างนี้เป็นแหล่งข้อมูลที่เป็นประโยชน์ในการสำรวจเพิ่มเติมเกี่ยวกับ API การประมวลผล C# PowerPoint

รับใบอนุญาตฟรี

รับ สิทธิ์ใช้งานฟรี และเพลิดเพลินไปกับการแยกเอกสารโดยไม่มีข้อจำกัดในการประเมิน

สรุป

การแยกเอกสารในภาษา C# มักใช้ในหลายกรณีที่จำเป็นต้องแปลงเอกสารขนาดใหญ่ให้มีขนาดเล็กลง เนื่องจากเอกสารที่มีจำนวนหน้า/แผ่นงาน/สไลด์น้อยกว่าจะจัดการและประมวลผลได้ง่ายกว่า เอกสารจึงถูกแบ่งออกเป็นหลายไฟล์ ในบทความนี้ เราได้สาธิตวิธีการแยกเอกสารในรูปแบบต่างๆ ใน C# เราได้ครอบคลุมการแยกไฟล์ PDF, Word, PowerPoint และ Excel ด้วยความช่วยเหลือของตัวอย่างโค้ด คุณสามารถผสานรวม API ที่มีให้และทำการแยกเอกสารในแอปพลิเคชัน C# ของคุณได้อย่างง่ายดาย

ดูสิ่งนี้ด้วย