แปลง PDF เป็น TXT ใน C#

ในฐานะโปรแกรมเมอร์ บ่อยครั้งที่คุณต้องแยกเนื้อหาจากไฟล์ PDF เป็นข้อความธรรมดาเพื่อการประมวลผลเพิ่มเติม เช่น การวิเคราะห์และการดึงข้อมูล การประมวลผลไฟล์ PDF และการแปลง PDF ทั้งหมดเป็นรูปแบบ TXT ถือเป็นงานที่ยุ่งยากเมื่อคุณไม่มีเครื่องมือที่เหมาะสม ดังนั้นในบล็อกนี้ เราจะมาดูวิธีแปลงไฟล์ PDF เป็นรูปแบบ TXT โดยทางโปรแกรมใน C#

ไลบรารี C# สำหรับการแปลง PDF เป็น TXT

Aspose.Words for .NET เป็น API การประมวลผลเอกสารที่น่าทึ่งที่ช่วยให้นักพัฒนาสามารถทำงานกับเอกสาร Word รวมถึงรูปแบบอื่นๆ มากมาย รวมถึง PDF ด้วยชุดฟีเจอร์ที่กว้างขวาง Aspose.Words ช่วยลดความยุ่งยากในการจัดการเอกสาร การแปลง และการสร้างงาน เราจะใช้ไลบรารีนี้เพื่อแปลงไฟล์ PDF เป็นรูปแบบ TXT ในแอปพลิเคชัน .NET

คุณสามารถติดตั้งไลบรารี่ได้จาก NuGet โดยใช้คำสั่งต่อไปนี้ หรือดาวน์โหลด DLL จากส่วน เผยแพร่

PM> Install-Package Aspose.Words 

แปลง PDF เป็น TXT ใน C#

Aspose.Words for .NET ซ่อนการดำเนินการที่ซับซ้อนทั้งหมดของการแยกข้อความจากไฟล์ PDF และช่วยให้คุณสามารถแปลง PDF เป็น TXT ได้ในไม่กี่ขั้นตอน ดังที่ได้กล่าวไว้ด้านล่าง

  • โหลดไฟล์ PDF
  • แปลง PDF เป็นรูปแบบ TXT ด้วยการเรียกใช้ฟังก์ชันเดียว

ดังนั้น ด้วยโค้ดสองสามบรรทัด คุณจึงสามารถแปลงเนื้อหาในไฟล์ PDF เป็นข้อความธรรมดาได้ ไม่ว่าไฟล์ PDF ต้นฉบับจะใหญ่แค่ไหนก็ตาม ตอนนี้เรามาเขียนโค้ดเพื่อทำการแปลงนี้ใน C#

  • ขั้นแรก โหลด PDF โดยใช้คลาส Document
  • จากนั้น บันทึกเอกสารเป็นไฟล์ TXT โดยใช้วิธี Document.Save(filePath)

ข้อมูลโค้ด C# ต่อไปนี้จะแปลงรูปแบบ PDF เป็นรูปแบบ TXT

// โหลดไฟล์ PDF
Document pdf = new Document("document.pdf");

// บันทึก PDF เป็น TXT
pdf.Save("pdf.txt", SaveFormat.Text);

รับใบอนุญาต API ฟรี

คุณสามารถรับ [ใบอนุญาตชั่วคราวฟรี] เพื่อแปลงไฟล์ PDF เป็นรูปแบบ TXT ได้โดยไม่มีข้อจำกัดในการประเมิน

บทสรุป

ในบล็อกโพสต์นี้ เราได้สำรวจวิธีการแปลง PDF เป็น TXT ในภาษา C# โดยใช้ไลบรารี Aspose.Words for .NET การปฏิบัติตามหลักเกณฑ์และการใช้ข้อมูลโค้ด คุณสามารถประมวลผลไฟล์ PDF ขนาดใหญ่และแปลงเป็นข้อความธรรมดาได้อย่างง่ายดาย Aspose.Words ทำให้งานประมวลผลเอกสารง่ายขึ้น ทำให้เป็นเครื่องมืออันมีค่าสำหรับนักพัฒนาที่ทำงานกับเอกสารรูปแบบต่างๆ ในแอปพลิเคชันของตน คุณสามารถเยี่ยมชม เอกสาร ของไลบรารีการประมวลผลคำ .NET นี้เพื่อสำรวจคุณสมบัติที่น่าทึ่งของมัน ในกรณีที่คุณมีคำถามใดๆ โปรดแจ้งให้เราทราบผ่าน ฟอรั่ม ของเรา

ดูสิ่งนี้ด้วย