תמונות ומסמכים סרוקים עשויים להכיל מידע טקסטואלי שאולי תצטרך לעבד אותו עוד יותר. ייתכן שלכדת תמונות של מסמכי טקסט באמצעות הטלפון החכם שברצונך להמיר למסמכים הניתנים לעריכה. לשם כך, ביצוע OCR על התמונות יכול להיות מועיל. עם OCR, אתה יכול להמיר תמונות למסמכי Word הניתנים לחיפוש ולעריכה. לשם כך, מאמר זה ילמד אותך כיצד להמיר תמונות למסמכי Word באמצעות C++.
- C++ API להמרת תמונות למסמכי Word
- המרת תמונה למסמך Word באמצעות C++
- המרת תמונה מוטה למסמך Word באמצעות C++
C++ API להמרת תמונות למסמכי Word
Aspose.OCR for C++ הוא API לזיהוי תווים אופטי שיכול לחלץ טקסט מתמונות. ה-API גם מאפשר לך להמיר תמונות למסמכי Word כמו קבצי DOC, DOCX ו-TXT. אתה יכול להתקין את ה-API דרך NuGet או להוריד אותו ישירות מהקטע הורדות.
PM> Install-Package Aspose.OCR.Cpp
המרת תמונה למסמך Word באמצעות C++
לעתים קרובות ייתכן שיהיה עליך לחפש או לערוך את הטקסט בתמונות, אך אינך יכול לעשות זאת. על ידי ביצוע OCR על תמונות כאלה והמרתן למסמכי Word, ניתן לחפש ולערוך את הטקסט לפי הצורך. כדי להשיג זאת, אנא בצע את השלבים המפורטים להלן.
- הכן את המאגר לתוצאה.
- הגדר את הערך של RecognitionSettings.saveformat חבר struct בתור fileformat::docx.
- בצע את פעולת ה-OCR בתמונה ושמור את קובץ ה-Word בשיטת asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).
הקוד לדוגמה הבא מראה כיצד להמיר תמונה למסמך Word באמצעות C++:
// נתיב קובץ המקור
std::string image_path = "SourceDirectory\\sample.png";
// הכן מאגר לתוצאה (בסמלים, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// הגדר את הגדרות הזיהוי
RecognitionSettings settings;
settings.save_format = file_format::docx;
// בצע את פעולת ה-OCR ושמור את קובץ הפלט.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
המרת תמונה מוטה למסמך Word באמצעות C++
תמונות ומסמכים סרוקים יכולים לפעמים להיות מוטים. עם Aspose.OCR עבור C++ API, אתה יכול לבצע OCR על תמונות מוטות. להלן השלבים להמרת תמונה מוטה למסמך Word:
- הכן את המאגר לתוצאה.
- חשב את זווית ההטיה של התמונה בשיטת asposeocrgetskew(const char \ imagepath).
- הגדר את הערך של RecognitionSettings.saveformat חבר struct בתור fileformat::docx.
- ציין את זווית ההטיה באמצעות איבר המבנה RecognitionSettings.skew.
- בצע את פעולת ה-OCR בתמונה ושמור את קובץ ה-Word בשיטת asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).
הקוד לדוגמה הבא מראה כיצד להמיר תמונה מוטה למסמך Word באמצעות C++:
// נתיב קובץ המקור
std::string image_path = "SourceDirectory\\skewSample.png";
// הכן מאגר לתוצאה (בסמלים, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// חשב זווית הטיה
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// הגדר את הגדרות הזיהוי
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;
// בצע את פעולת ה-OCR ושמור את קובץ הפלט.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
קבל רישיון חינם
על מנת לנסות את ה-API ללא מגבלות הערכה, אתה יכול לבקש רישיון זמני בחינם.
סיכום
במאמר זה, למדת כיצד להמיר תמונות למסמכי Word באמצעות C++. יתר על כן, ראית כיצד לחשב ולהשתמש בזווית ההטיה של תמונה כדי לבצע OCR על תמונות מוטות. ה-API מספק תכונות נוספות רבות שתוכל לחקור בפירוט על ידי ביקור בתיעוד הרשמי. בכל שאלה, אל תהסס לפנות אלינו ב[פורום התמיכה החינמי] שלנו15.