קבצי PDF סרוקים כוללים נתונים בפורמט תמונה מכיוון שהם נוצרים לרוב על ידי סורקים. במצבים מסוימים, ייתכן שתדרוש מידע מספרי מקובץ PDF סרוק. אז אתה יכול לבצע פעולות OCR ליצירת קובץ אקסל. מאמר זה מכסה כיצד ליצור ממיר PDF ל-Excel סרוק עם תכונת OCR באופן תוכנתי ב-Java.
צור ממיר PDF ל-Excel סרוק עם OCR - התקנת Java API
אתה יכול לזהות אופטית את הטקסט בקובץ PDF עם תכונת OCR באמצעות Aspose.OCR for Java API. כל שעליך לעשות הוא להתקין את ה-API על ידי הורדת קובץ ה-JAR מהקטע מהדורות חדשות, או שימוש במפרטי Maven להלן:
מאגר:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
תלות:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>21.12</version>
</dependency>
המר PDF סרוק ל-Excel באופן פרוגרמטי ב-Java
אתה יכול להמיר קובץ PDF סרוק ל-Excel עם OCR על ידי ביצוע השלבים הבאים:
- צור אובייקט מחלקה AsposeOcr.
- ציין את ההגדרות עם המחלקה DocumentRecognitionSettings.
- זהה את קובץ ה-PDF הסרוק בשיטת RecognizePdf.
- שמור תוצאת OCR פלט כקובץ Excel.
קטע הקוד הבא מפרט כיצד להמיר קובץ PDF סרוק לקובץ Excel באופן תוכנתי ב-Java:
// נתיב קובץ PDF סרוק
String fullPath = "scanned.pdf";
// אתחול אובייקט המחלקה AsposeOcr
AsposeOCRPdf api = new AsposeOCRPdf();
// אתחול אובייקט המחלקה DocumentRecognitionSettings
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);
// זיהוי תמונות מ-PDF
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);
// שמור את התוצאה כקובץ XLSX של Excel
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);
קבל רישיון הערכה בחינם
אתה יכול להעריך את ה-API ליצירת ממיר PDF ל-Excel סרוק על ידי פעולות OCR ללא כל הגבלה על ידי בקשת [רישיון זמני חינם].
סיכום
במאמר זה, הבנתם כיצד להמיר קובץ PDF סרוק לקובץ Excel עם תכונת ה-OCR באופן פרוגרמטי ב-Java. יתר על כן, אנא עיין בתכונות אחרות הקשורות ל-OCR על ידי ביקור בתיעוד. אל תהסס לכתוב לנו בפורום בכל מקרה של חששות.