แปลง Word DOC เป็น TXT ใน C#

ในขอบเขตของการประมวลผลเอกสาร มักจำเป็นต้องแปลงเอกสาร Word เป็นรูปแบบข้อความธรรมดาที่เรียบง่ายกว่า ไม่ว่าจะเพื่อการดึงข้อมูล การวิเคราะห์เนื้อหา หรือเหตุผลด้านความเข้ากันได้ ความสามารถในการแปลงไฟล์ Word (.doc, .docx) ให้เป็นข้อความธรรมดา (.txt) ถือเป็นทักษะอันมีค่าสำหรับนักพัฒนา ในบล็อกโพสต์นี้ เราจะสำรวจวิธีแปลงเอกสาร Word เป็นรูปแบบ TXT ในแอปพลิเคชัน C#

ไลบรารี C# สำหรับการแปลง Word เป็น TXT

Aspose.Words for .NET เป็นไลบรารีการประมวลผลเอกสารที่มีคุณสมบัติหลากหลายซึ่งช่วยให้นักพัฒนาสามารถทำงานกับเอกสาร Word ในรูปแบบต่างๆ โดยมีชุด API สำหรับการสร้าง การจัดการ การแปลง และการเรนเดอร์เอกสาร เราจะใช้ไลบรารีนี้เพื่อแยกเนื้อหาจากเอกสาร Word เป็นข้อความธรรมดา

หากต้องการติดตั้งไลบรารีจาก NuGet คุณสามารถใช้คำสั่งต่อไปนี้ หรือคุณสามารถดาวน์โหลดได้จากส่วน เผยแพร่

PM> Install-Package Aspose.Words 

ขั้นตอนในการแปลง Word DOC เป็น TXT

คุณสามารถแยกข้อความจากเอกสาร Word และบันทึกในรูปแบบ TXT ได้ในไม่กี่ขั้นตอน เนื่องจาก Aspose.Words for .NET ทำให้มันค่อนข้างง่าย ด้านล่างนี้เป็นขั้นตอนที่เราต้องทำสำหรับการแปลง Word เป็น TXT

  • โหลดไฟล์ Word DOC/DOCX
  • แปลงเป็นรูปแบบ TXT และบันทึกไฟล์ไปยังตำแหน่งที่ต้องการ

ดังนั้นคุณจึงไม่ต้องแยกวิเคราะห์เอกสาร Word ทั้งหมดและแยกข้อความทีละบรรทัดหรือทีละหน้า ตอนนี้เรามาเขียนโค้ด C# เพื่อแยกข้อความจากเอกสาร Word กัน

แปลง Word DOC เป็น TXT ใน C

ต่อไปนี้เป็นขั้นตอนในการบันทึกเอกสาร Word DOC หรือ DOCX เป็นไฟล์ TXT ใน C#

  • ขั้นแรก โหลด Word DOC/DOCX โดยใช้คลาส Document
  • จากนั้น บันทึกเอกสารเป็นไฟล์ TXT โดยใช้วิธี Document.Save(filePath)

ข้อมูลโค้ด C# ต่อไปนี้จะแปลงเอกสาร Word เป็นรูปแบบ TXT

// โหลดไฟล์เวิร์ด
Document doc = new Document("document.docx");

// บันทึกเอกสารเป็นไฟล์ TXT
doc.Save("doc-to-text.txt");

ใช้ตัวแปลง C# Word เป็น TXT ฟรี

คุณสามารถรับ ใบอนุญาตชั่วคราวฟรี เพื่อแปลงไฟล์ Word เป็นรูปแบบ TXT โดยไม่มีข้อจำกัดในการประเมิน

สำรวจไลบรารี C# Word

คุณสามารถไปที่ เอกสาร ของไลบรารี C# Word เพื่อสำรวจคุณสมบัติอื่นๆ ในกรณีที่คุณมีคำถามใดๆ โปรดแจ้งให้เราทราบผ่านทาง ฟอรั่ม ของเรา

บทสรุป

ในบล็อกโพสต์นี้ เราได้สำรวจวิธีการแปลงเอกสาร Word เป็นไฟล์ TXT ในภาษา C# โดยใช้ Aspose.Words for .NET ไม่จำเป็นต้องแยกวิเคราะห์เอกสาร Word ทั้งหมด เพียงแยกข้อความธรรมดาออกจากเอกสารในไม่กี่ขั้นตอน Aspose.Words ทำให้กระบวนการทำงานกับเอกสาร Word ง่ายขึ้นโดยทางโปรแกรม มอบโซลูชันที่เชื่อถือได้และมีประสิทธิภาพสำหรับงานการแปลงเอกสาร การรวมไลบรารีนี้เข้ากับโปรเจ็กต์ C# ของคุณช่วยให้คุณจัดการการประมวลผลเอกสารได้อย่างง่ายดาย เปิดโลกแห่งความเป็นไปได้สำหรับแอปพลิเคชันของคุณ

ดูสิ่งนี้ด้วย