convert-Image-to-DOCX-OCR-java

Ви можете перетворити зображення на документ Word із можливістю пошуку або редагування у форматі DOCX, а також у форматі DOC. Такі популярні формати зображень, як JPG, PNG, TIFF, BMP тощо, можна конвертувати в документ Word (DOC/DOCX) за допомогою OCR у Java. Щоб дізнатися більше, зверніться до наступних тем:

Конвертер зображень у документ Word – встановлення Java API

Aspose.OCR for Java можна використовувати для ефективного оптичного розпізнавання символів зображень. Ви можете програмно конвертувати скановані зображення у файли DOCX з можливістю пошуку за допомогою Java. Будь ласка, завантажте файл JAR із New Releases або налаштуйте його у файлі pom.xml вашого проекту на основі Maven, як описано в розділі:

Репозиторій:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Залежність:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Перетворення зображення на документ Word із можливістю пошуку (DOC/DOCX) за допомогою Java

Ви можете перетворити зображення на текстовий документ із можливістю пошуку, виконавши наведені нижче дії.

  1. Оголосити екземпляр класу AsposeOcr.
  2. Створити екземпляр об’єкта класу RecognitionSettings.
  3. Розпізнайте вхідне зображення за допомогою методу RecognizePage.
  4. Нарешті збережіть результат у форматі документа Microsoft Word (DOC/DOCX).

Наступний код показує, як перетворити зображення на документ Word (DOC/DOCX) за допомогою Java:

// Ініціалізуйте екземпляр AsposeOcr
AsposeOCR api = new AsposeOCR();

// Створення екземпляра об’єкта класу RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Розпізнайте вхідне зображення за допомогою методу RecognizePage
RecognitionResult result = api.RecognizePage("sample.png", settings);

// Збережіть результат у форматі Microsoft Word Document
result.save("sample.docx", Format.Docx);

Перетворіть зображення на документ Word із можливістю пошуку (DOC/DOCX) за допомогою перевірки правопису в Java

Ви можете перетворити зображення на документ Word (DOCX/DOC), виконавши такі дії:

  1. По-перше, вкажіть екземпляр класу AsposeOcr.
  2. Оголосити об’єкт класу RecognitionSettings.
  3. Розпізнайте зображення за допомогою OCR за допомогою методу RecognizePage.
  4. Збережіть результат у форматі Word Document (DOC/DOCX) із перевіркою орфографії.

Наведений нижче код пояснює, як перетворити зображення на текстовий документ із можливістю пошуку за допомогою перевірки правопису в Java:

// Ініціалізуйте екземпляр AsposeOcr
AsposeOCR api = new AsposeOCR();

// Створення екземпляра об’єкта класу RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Розпізнайте зображення за допомогою OCR за допомогою методу RecognizePage
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);

// Збережіть результат у форматі Word Document (DOC/DOCX) із перевіркою орфографії
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);

Отримайте безкоштовну ліцензію API

Ви можете протестувати API на повну потужність за допомогою Безкоштовної тимчасової ліцензії.

Висновок

У цій статті ви дізналися, як перетворити зображення на документ Word (DOC/DOCX). Крім того, ви можете підвищити точність, перевіривши орфографію за допомогою відповідного словника. Перегляньте API документацію для отримання додаткової інформації. Крім того, ви можете зв’язатися з нами на безкоштовному форумі підтримки.

Дивись також