Выполнение оптического распознавания символов с помощью Java

Технология Оптического распознавания символов (OCR) позволила распознавать и читать текст в отсканированных документах и изображениях. OCR позволяет преобразовать текст, предназначенный только для чтения, в редактируемую форму. Преобразованный текст может быть дополнительно обработан для таких операций, как анализ текста. В этой статье я покажу вам, как выполнять распознавание изображений (PNG, JPG, BMP и GIF) и преобразовывать изображения в текст. используя Java OCR API - Aspose.OCR для Java.

Совет: вас может заинтересовать бесплатный конвертер текста в GIF, который позволяет создавать анимацию из текста.

Java OCR API — установка

Aspose.OCR для Java можно загрузить в виде JAR или установить в приложении на основе Maven, используя следующие конфигурации.

Репозиторий:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Зависимость:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Преобразование изображения в текст с помощью Java

Чаще всего изображениями для распознавания являются страницы отсканированных документов, счетов-фактур, квитанций, счетов и т. д., где текст состоит из нескольких строк. В таких сценариях вам нужно извлечь весь текст из изображения. Ниже приведены шаги для выполнения OCR на изображении, содержащем несколько строк текста, с использованием Aspose.OCR для Java.

  • Создайте экземпляр класса AsposeOcr.
  • Преобразуйте изображение в текст с помощью метода AsposeOcr.recognizePage(String fullPath), передав путь к изображению.
  • Получите преобразованный текст в строковый объект.

В следующем примере кода показано, как выполнять распознавание символов на изображении и преобразовывать изображение в текст с помощью Java.

// Полные примеры и файлы данных см. на странице https://github.com/aspose-ocr/Aspose.OCR-for-Java.
// Путь к каталогу документов.
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);

// Путь изображения
String imagePath = dataDir + "p3.png";

//Создать экземпляр API
AsposeOCR api = new AsposeOCR();

// Распознать страницу по полному пути к файлу
try {
	String result = api.RecognizePage(imagePath);
	System.out.println("Result: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Преобразование изображений с одной строкой текста

В предыдущем примере мы выполнили распознавание текста на изображении с несколькими строками текста. Однако возможен случай, когда изображение содержит одну строку текста. В таком случае вы можете соответствующим образом настроить API. Ниже приведены шаги для преобразования изображения с одной строкой текста.

  • Создайте объект класса AsposeOcr.
  • Преобразование изображения в текст с помощью метода AsposeOcr.recognizeLine(String fullPath).
  • Получить результат в строковый объект.

В следующем примере кода показано, как выполнять распознавание символов на изображении, содержащем одну строку текста, с помощью Java.

// Полные примеры и файлы данных см. на странице https://github.com/aspose-ocr/Aspose.OCR-for-Java.
// Путь к каталогу документов.
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);

// Путь изображения
String imagePath = dataDir + "0001460985.Jpeg";

//Создать экземпляр API
AsposeOCR api = new AsposeOCR();

try {
	String result = api.RecognizeLine(imagePath);
	System.out.println("File: " + imagePath);
	System.out.println("Result line: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Вывод

В этой статье вы увидели, как конвертировать изображения PNG, JPG, BMP и GIF в текст с помощью Java OCR API. В примерах кода показано, как выполнять распознавание символов для изображений с одной или несколькими строками текста в приложениях Java. Вы можете узнать больше об API Aspose для распознавания символов Java, используя документацию.

Смотрите также