בצע OCR באמצעות Java

טכנולוגיית זיהוי תווים אופטי(OCR) אפשרה לזהות ולקרוא את הטקסט בתוך המסמכים והתמונות הסרוקות. OCR מאפשר לך להמיר את הטקסט לקריאה בלבד לטופס הניתן לעריכה. ניתן לעבד את הטקסט המומר לפעולות כמו ניתוח טקסט. במאמר זה, אני אראה לך כיצד לבצע OCR על תמונות (PNG, JPG, BMP ו-GIF) ולהמיר תמונות לטקסט באמצעות Java OCR API - Aspose.OCR for Java.

טיפ: ייתכן שתתעניין ב[ממיר טקסט ל-GIF] בחינם 7 המאפשר לך ליצור אנימציות מטקסטים.

Java OCR API - התקנה

ניתן להוריד את Aspose.OCR עבור Java כ-JAR או להתקין בתוך יישום מבוסס Maven באמצעות התצורות הבאות.

מאגר:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

תלות:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

המרת תמונה לטקסט באמצעות Java

לרוב, התמונות ל-OCR הן דפי מסמכים סרוקים, חשבוניות, קבלות, חשבונות וכו’ כאשר הטקסט מורכב ממספר שורות. בתרחישים כאלה, עליך לאחזר את כל הטקסט מהתמונה. להלן השלבים לביצוע OCR בתמונה בעלת שורות טקסט מרובות באמצעות Aspose.OCR עבור Java.

  • צור מופע של המחלקה AsposeOcr.
  • המר תמונה לטקסט באמצעות שיטת AsposeOcr.recognizePage(String fullPath) על ידי העברת נתיב התמונה.
  • קבל את הטקסט המומר לאובייקט מחרוזת.

דוגמת הקוד הבאה מראה כיצד לבצע OCR על תמונה ולהמיר תמונה לטקסט באמצעות Java.

// לדוגמאות מלאות וקבצי נתונים, נא עבור אל https://github.com/aspose-ocr/Aspose.OCR-for-Java
// הנתיב לספריית המסמכים.
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);

// נתיב התמונה
String imagePath = dataDir + "p3.png";

//צור מופע API
AsposeOCR api = new AsposeOCR();

// זיהוי עמוד לפי נתיב מלא לקובץ
try {
	String result = api.RecognizePage(imagePath);
	System.out.println("Result: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

המר תמונות עם שורת טקסט בודדת

בדוגמה הקודמת, ביצענו OCR על תמונה בעלת שורות טקסט מרובות. עם זאת, יכול להיות מקרה שהתמונה מכילה שורת טקסט בודדת. במקרה כזה, תוכל להגדיר את ה-API בהתאם. להלן השלבים להמרת תמונה בעלת שורת טקסט אחת.

דוגמת הקוד הבאה מראה כיצד לבצע OCR בתמונה בעלת שורת טקסט אחת באמצעות Java.

// לדוגמאות מלאות וקבצי נתונים, נא עבור אל https://github.com/aspose-ocr/Aspose.OCR-for-Java
// הנתיב לספריית המסמכים.
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);

// נתיב התמונה
String imagePath = dataDir + "0001460985.Jpeg";

//צור מופע API
AsposeOCR api = new AsposeOCR();

try {
	String result = api.RecognizeLine(imagePath);
	System.out.println("File: " + imagePath);
	System.out.println("Result line: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

סיכום

במאמר זה, ראית כיצד להמיר תמונות PNG, JPG, BMP ו-GIF לטקסט באמצעות Java OCR API. דוגמאות הקוד מראות כיצד לבצע OCR על תמונות עם שורות טקסט בודדות או מרובות בתוך יישומי Java. אתה יכול ללמוד עוד על Java OCR API של Aspose באמצעות תיעוד.

ראה גם