Технология Оптического распознавания символов (OCR) позволила распознавать и читать текст в отсканированных документах и изображениях. OCR позволяет преобразовать текст, предназначенный только для чтения, в редактируемую форму. Преобразованный текст может быть дополнительно обработан для таких операций, как анализ текста. В этой статье я покажу вам, как выполнять распознавание изображений (PNG, JPG, BMP и GIF) и преобразовывать изображения в текст. используя Java OCR API - Aspose.OCR для Java.
- Java OCR API — установка
- Преобразование изображения в текст с помощью Java
- Преобразование изображений с одной строкой текста с использованием Java
Совет: вас может заинтересовать бесплатный конвертер текста в GIF, который позволяет создавать анимацию из текста.
Java OCR API — установка
Aspose.OCR для Java можно загрузить в виде JAR или установить в приложении на основе Maven, используя следующие конфигурации.
Репозиторий:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
Зависимость:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>20.5</version>
</dependency>
Преобразование изображения в текст с помощью Java
Чаще всего изображениями для распознавания являются страницы отсканированных документов, счетов-фактур, квитанций, счетов и т. д., где текст состоит из нескольких строк. В таких сценариях вам нужно извлечь весь текст из изображения. Ниже приведены шаги для выполнения OCR на изображении, содержащем несколько строк текста, с использованием Aspose.OCR для Java.
- Создайте экземпляр класса AsposeOcr.
- Преобразуйте изображение в текст с помощью метода AsposeOcr.recognizePage(String fullPath), передав путь к изображению.
- Получите преобразованный текст в строковый объект.
В следующем примере кода показано, как выполнять распознавание символов на изображении и преобразовывать изображение в текст с помощью Java.
// Полные примеры и файлы данных см. на странице https://github.com/aspose-ocr/Aspose.OCR-for-Java.
// Путь к каталогу документов.
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);
// Путь изображения
String imagePath = dataDir + "p3.png";
//Создать экземпляр API
AsposeOCR api = new AsposeOCR();
// Распознать страницу по полному пути к файлу
try {
String result = api.RecognizePage(imagePath);
System.out.println("Result: " + result);
} catch (IOException e) {
e.printStackTrace();
}
Преобразование изображений с одной строкой текста
В предыдущем примере мы выполнили распознавание текста на изображении с несколькими строками текста. Однако возможен случай, когда изображение содержит одну строку текста. В таком случае вы можете соответствующим образом настроить API. Ниже приведены шаги для преобразования изображения с одной строкой текста.
- Создайте объект класса AsposeOcr.
- Преобразование изображения в текст с помощью метода AsposeOcr.recognizeLine(String fullPath).
- Получить результат в строковый объект.
В следующем примере кода показано, как выполнять распознавание символов на изображении, содержащем одну строку текста, с помощью Java.
// Полные примеры и файлы данных см. на странице https://github.com/aspose-ocr/Aspose.OCR-for-Java.
// Путь к каталогу документов.
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);
// Путь изображения
String imagePath = dataDir + "0001460985.Jpeg";
//Создать экземпляр API
AsposeOCR api = new AsposeOCR();
try {
String result = api.RecognizeLine(imagePath);
System.out.println("File: " + imagePath);
System.out.println("Result line: " + result);
} catch (IOException e) {
e.printStackTrace();
}
Вывод
В этой статье вы увидели, как конвертировать изображения PNG, JPG, BMP и GIF в текст с помощью Java OCR API. В примерах кода показано, как выполнять распознавание символов для изображений с одной или несколькими строками текста в приложениях Java. Вы можете узнать больше об API Aspose для распознавания символов Java, используя документацию.