Вы можете преобразовать изображение в текстовый документ с возможностью поиска или редактирования в формате файла DOCX, а также в формате файла DOC. Популярные форматы изображений, такие как JPG, PNG, TIFF, BMP и т. д., можно преобразовать в текстовый документ (DOC/DOCX) с распознаванием символов в Ява. Пожалуйста, обратитесь к следующим темам, чтобы узнать больше:
- Конвертер изображений в документы Word — установка Java API
- Преобразование изображения в документ Word с возможностью поиска (DOC/DOCX) с использованием Java
- Преобразование изображения в документ Word с возможностью поиска (DOC/DOCX) с проверкой орфографии в Java
Конвертер изображений в документы Word — установка Java API
Aspose.OCR for Java можно использовать для эффективного оптического распознавания символов изображений. Вы можете преобразовать отсканированные изображения в доступные для поиска файлы DOCX программно с помощью Java. Загрузите файл JAR из Новые выпуски или настройте его в файле pom.xml вашего проекта на основе Maven, как описано ниже:
Репозиторий:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
Зависимость:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>20.5</version>
</dependency>
Преобразование изображения в документ Word с возможностью поиска (DOC/DOCX) с использованием Java
Вы можете преобразовать изображение в текстовый документ с возможностью поиска, выполнив следующие действия:
- Объявите экземпляр класса AsposeOcr.
- Создайте объект класса RecognitionSettings.
- Распознайте входное изображение методом RecognizePage.
- Наконец, сохраните вывод в формате документа Microsoft Word (DOC/DOCX).
В следующем коде показано, как преобразовать изображение в текстовый документ (DOC/DOCX) с помощью Java:
// Инициализировать экземпляр AsposeOcr
AsposeOCR api = new AsposeOCR();
// Создание экземпляра объекта класса RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();
// Распознайте входное изображение с помощью метода RecognizePage
RecognitionResult result = api.RecognizePage("sample.png", settings);
// Сохраните результат в формате документа Microsoft Word.
result.save("sample.docx", Format.Docx);
Преобразование изображения в документ Word с возможностью поиска (DOC/DOCX) с проверкой орфографии в Java
Вы можете преобразовать изображение в текстовый документ (DOCX/DOC), выполнив следующие действия:
- Во-первых, укажите экземпляр класса AsposeOcr.
- Объявите объект класса RecognitionSettings.
- Распознайте изображение с помощью OCR, используя метод RecognizePage.
- Сохраните результат в формате документа Word (DOC/DOCX) с проверкой орфографии.
В приведенном ниже коде объясняется, как преобразовать изображение в текстовый документ с возможностью поиска с проверкой орфографии в Java:
// Инициализировать экземпляр AsposeOcr
AsposeOCR api = new AsposeOCR();
// Создание экземпляра объекта класса RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();
// Распознайте изображение с помощью OCR, используя метод RecognizePage
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);
// Сохраните результат в формате документа Word (DOC/DOCX) с проверкой орфографии.
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);
Получить бесплатную лицензию API
Вы можете протестировать API в полном объеме с Бесплатной временной лицензией.
Вывод
В этой статье вы узнали, как преобразовать изображение в текстовый документ (DOC/DOCX). Кроме того, вы можете повысить точность, проверяя орфографию по соответствующему словарю. Пожалуйста, ознакомьтесь с API документация для получения дополнительной информации. Кроме того, вы можете связаться с нами на Форуме бесплатной поддержки.