преобразовать-изображение-в-DOCX-OCR-java

Вы можете преобразовать изображение в текстовый документ с возможностью поиска или редактирования в формате файла DOCX, а также в формате файла DOC. Популярные форматы изображений, такие как JPG, PNG, TIFF, BMP и т. д., можно преобразовать в текстовый документ (DOC/DOCX) с распознаванием символов в Ява. Пожалуйста, обратитесь к следующим темам, чтобы узнать больше:

Конвертер изображений в документы Word — установка Java API

Aspose.OCR for Java можно использовать для эффективного оптического распознавания символов изображений. Вы можете преобразовать отсканированные изображения в доступные для поиска файлы DOCX программно с помощью Java. Загрузите файл JAR из Новые выпуски или настройте его в файле pom.xml вашего проекта на основе Maven, как описано ниже:

Репозиторий:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Зависимость:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Преобразование изображения в документ Word с возможностью поиска (DOC/DOCX) с использованием Java

Вы можете преобразовать изображение в текстовый документ с возможностью поиска, выполнив следующие действия:

  1. Объявите экземпляр класса AsposeOcr.
  2. Создайте объект класса RecognitionSettings.
  3. Распознайте входное изображение методом RecognizePage.
  4. Наконец, сохраните вывод в формате документа Microsoft Word (DOC/DOCX).

В следующем коде показано, как преобразовать изображение в текстовый документ (DOC/DOCX) с помощью Java:

// Инициализировать экземпляр AsposeOcr
AsposeOCR api = new AsposeOCR();

// Создание экземпляра объекта класса RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Распознайте входное изображение с помощью метода RecognizePage
RecognitionResult result = api.RecognizePage("sample.png", settings);

// Сохраните результат в формате документа Microsoft Word.
result.save("sample.docx", Format.Docx);

Преобразование изображения в документ Word с возможностью поиска (DOC/DOCX) с проверкой орфографии в Java

Вы можете преобразовать изображение в текстовый документ (DOCX/DOC), выполнив следующие действия:

  1. Во-первых, укажите экземпляр класса AsposeOcr.
  2. Объявите объект класса RecognitionSettings.
  3. Распознайте изображение с помощью OCR, используя метод RecognizePage.
  4. Сохраните результат в формате документа Word (DOC/DOCX) с проверкой орфографии.

В приведенном ниже коде объясняется, как преобразовать изображение в текстовый документ с возможностью поиска с проверкой орфографии в Java:

// Инициализировать экземпляр AsposeOcr
AsposeOCR api = new AsposeOCR();

// Создание экземпляра объекта класса RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Распознайте изображение с помощью OCR, используя метод RecognizePage
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);

// Сохраните результат в формате документа Word (DOC/DOCX) с проверкой орфографии.
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);

Получить бесплатную лицензию API

Вы можете протестировать API в полном объеме с Бесплатной временной лицензией.

Вывод

В этой статье вы узнали, как преобразовать изображение в текстовый документ (DOC/DOCX). Кроме того, вы можете повысить точность, проверяя орфографию по соответствующему словарю. Пожалуйста, ознакомьтесь с API документация для получения дополнительной информации. Кроме того, вы можете связаться с нами на Форуме бесплатной поддержки.

Смотрите также