ในขอบเขตของการประมวลผลเอกสาร มักจำเป็นต้องแปลงเอกสาร Word เป็นรูปแบบข้อความธรรมดาที่เรียบง่ายกว่า ไม่ว่าจะเพื่อการดึงข้อมูล การวิเคราะห์เนื้อหา หรือเหตุผลด้านความเข้ากันได้ ความสามารถในการแปลงไฟล์ Word (.doc, .docx) ให้เป็นข้อความธรรมดา (.txt) ถือเป็นทักษะอันมีค่าสำหรับนักพัฒนา ในบล็อกโพสต์นี้ เราจะสำรวจวิธีแปลงเอกสาร Word เป็นรูปแบบ TXT ในแอปพลิเคชัน C#
- โปรแกรมแปลงไฟล์ C# Word เป็น TXT
- ขั้นตอนในการแปลง DOC เป็น TXT ใน C#
- รหัส C# เพื่อแปลงไฟล์ Word เป็น TXT
ไลบรารี C# สำหรับการแปลง Word เป็น TXT
Aspose.Words for .NET เป็นไลบรารีการประมวลผลเอกสารที่มีคุณสมบัติหลากหลายซึ่งช่วยให้นักพัฒนาสามารถทำงานกับเอกสาร Word ในรูปแบบต่างๆ โดยมีชุด API สำหรับการสร้าง การจัดการ การแปลง และการเรนเดอร์เอกสาร เราจะใช้ไลบรารีนี้เพื่อแยกเนื้อหาจากเอกสาร Word เป็นข้อความธรรมดา
หากต้องการติดตั้งไลบรารีจาก NuGet คุณสามารถใช้คำสั่งต่อไปนี้ หรือคุณสามารถดาวน์โหลดได้จากส่วน เผยแพร่
PM> Install-Package Aspose.Words
ขั้นตอนในการแปลง Word DOC เป็น TXT
คุณสามารถแยกข้อความจากเอกสาร Word และบันทึกในรูปแบบ TXT ได้ในไม่กี่ขั้นตอน เนื่องจาก Aspose.Words for .NET ทำให้มันค่อนข้างง่าย ด้านล่างนี้เป็นขั้นตอนที่เราต้องทำสำหรับการแปลง Word เป็น TXT
- โหลดไฟล์ Word DOC/DOCX
- แปลงเป็นรูปแบบ TXT และบันทึกไฟล์ไปยังตำแหน่งที่ต้องการ
ดังนั้นคุณจึงไม่ต้องแยกวิเคราะห์เอกสาร Word ทั้งหมดและแยกข้อความทีละบรรทัดหรือทีละหน้า ตอนนี้เรามาเขียนโค้ด C# เพื่อแยกข้อความจากเอกสาร Word กัน
แปลง Word DOC เป็น TXT ใน C
ต่อไปนี้เป็นขั้นตอนในการบันทึกเอกสาร Word DOC หรือ DOCX เป็นไฟล์ TXT ใน C#
- ขั้นแรก โหลด Word DOC/DOCX โดยใช้คลาส Document
- จากนั้น บันทึกเอกสารเป็นไฟล์ TXT โดยใช้วิธี Document.Save(filePath)
ข้อมูลโค้ด C# ต่อไปนี้จะแปลงเอกสาร Word เป็นรูปแบบ TXT
// โหลดไฟล์เวิร์ด
Document doc = new Document("document.docx");
// บันทึกเอกสารเป็นไฟล์ TXT
doc.Save("doc-to-text.txt");
ใช้ตัวแปลง C# Word เป็น TXT ฟรี
คุณสามารถรับ ใบอนุญาตชั่วคราวฟรี เพื่อแปลงไฟล์ Word เป็นรูปแบบ TXT โดยไม่มีข้อจำกัดในการประเมิน
สำรวจไลบรารี C# Word
คุณสามารถไปที่ เอกสาร ของไลบรารี C# Word เพื่อสำรวจคุณสมบัติอื่นๆ ในกรณีที่คุณมีคำถามใดๆ โปรดแจ้งให้เราทราบผ่านทาง ฟอรั่ม ของเรา
บทสรุป
ในบล็อกโพสต์นี้ เราได้สำรวจวิธีการแปลงเอกสาร Word เป็นไฟล์ TXT ในภาษา C# โดยใช้ Aspose.Words for .NET ไม่จำเป็นต้องแยกวิเคราะห์เอกสาร Word ทั้งหมด เพียงแยกข้อความธรรมดาออกจากเอกสารในไม่กี่ขั้นตอน Aspose.Words ทำให้กระบวนการทำงานกับเอกสาร Word ง่ายขึ้นโดยทางโปรแกรม มอบโซลูชันที่เชื่อถือได้และมีประสิทธิภาพสำหรับงานการแปลงเอกสาร การรวมไลบรารีนี้เข้ากับโปรเจ็กต์ C# ของคุณช่วยให้คุณจัดการการประมวลผลเอกสารได้อย่างง่ายดาย เปิดโลกแห่งความเป็นไปได้สำหรับแอปพลิเคชันของคุณ