המרת PDF ל-TXT ב-C#

כמתכנת, לעתים קרובות אתה צריך לחלץ תוכן מקובצי PDF כטקסט רגיל לעיבוד נוסף, כגון ניתוח וחילוץ מידע. עיבוד קובצי PDF והמרת PDF שלם לפורמט TXT היא משימה בעייתית כאשר אין לך את הכלים הנכונים. אז בבלוג הזה, נחקור כיצד להמיר קובץ PDF לפורמט TXT באופן תכנותי ב-C#.

ספריית C# להמרת PDF ל-TXT

Aspose.Words for .NET הוא ממשק API מדהים לעיבוד מסמכים המאפשר למפתחים לעבוד עם מסמכי Word, כמו גם פורמטים שונים אחרים, כולל PDF. עם מערך התכונות הנרחב שלו, Aspose.Words מפשט את מניפולציות המסמכים, ההמרה והיצירת משימות. אנו נשתמש בספרייה זו כדי להמיר קבצי PDF לפורמט TXT ביישום NET.

אתה יכול להתקין את הספרייה מ-NuGet באמצעות הפקודה הבאה. לחלופין, הורד את ה-DLL שלו מהסעיף Releases.

PM> Install-Package Aspose.Words 

המרת PDF ל-TXT ב-C#

Aspose.Words עבור NET מסתיר את כל הפעולות המורכבות של חילוץ טקסט מקובצי PDF ומאפשר לך לבצע המרת PDF ל-TXT בכמה שלבים, כפי שצוין להלן.

  • טען את קובץ ה-PDF.
  • המר PDF לפורמט TXT באמצעות קריאת פונקציה אחת.

לפיכך, עם כמה שורות קוד, אתה יכול להמיר תוכן בקובץ PDF לטקסט רגיל, לא משנה כמה גדול ה-PDF המקור. כעת נכתוב את הקוד לביצוע המרה זו ב-C#.

  • ראשית, טען את ה-PDF באמצעות המחלקה Document.
  • לאחר מכן, שמור את המסמך כקובץ TXT בשיטת Document.Save(filePath).

קטע הקוד הבא של C# ממיר PDF לפורמט TXT.

// טען קובץ PDF
Document pdf = new Document("document.pdf");

// שמור PDF כ-TXT
pdf.Save("pdf.txt", SaveFormat.Text);

קבל רישיון API בחינם

אתה יכול לקבל [רישיון זמני] בחינם2 להמרת קבצי PDF לפורמט TXT ללא מגבלות הערכה.

סיכום

בפוסט זה בבלוג, חקרנו כיצד להמיר PDF ל-TXT ב-C# באמצעות ספריית Aspose.Words for NET. בהתאם להנחיות ושימוש בקטע הקוד, תוכל לעבד בקלות קבצי PDF גדולים ולהמיר אותם לטקסט רגיל. Aspose.Words מפשט את משימות עיבוד המסמכים, מה שהופך אותו לכלי בעל ערך עבור מפתחים העובדים עם פורמטים שונים של מסמכים ביישומים שלהם. אתה יכול לבקר בתיעוד של ספריית עיבוד התמלילים של .NET זו כדי לחקור את התכונות המדהימות שלה. אם יהיו לך שאלות כלשהן, אל תהסס ליידע אותנו דרך הפורום שלנו.

ראה גם