Obraz tekstu do programu Word w Python | Obraz do DOCX OCR

Czy jesteś zmęczony ręcznym przepisywaniem tekstu z obrazów? Jeśli masz kolekcję zeskanowanych dokumentów, zrzutów ekranu lub obrazów zawierających tekst, który chcesz edytować, nie szukaj dalej! Możesz łatwo wykonać OCR na obrazach JPG lub PNG i wyodrębnić tekst. W tym poście na blogu przyjrzymy się sposobom konwertowania tekstu obrazu na dokumenty programu Word w języku Python, co ułatwi pracę z danymi tekstowymi i manipulowanie nimi. Ten przewodnik z łatwością przeprowadzi Cię przez proces wyodrębniania tekstu z obrazów i pokaże, jak zapisać go w formacie DOCX.

W tym artykule poruszono następujące tematy:

Obraz tekstu do programu Word za pomocą biblioteki OCR języka Python

Użyjemy Aspose.OCR for Python, aby przekonwertować tekst obrazu na Word w Python. Jest to potężne i wydajne narzędzie do wyodrębniania tekstu z obrazów i konwertowania go na edytowalne dokumenty Word. Dzięki zaawansowanej technologii OCR dokładnie rozpoznaje i wyodrębnia tekst z różnych formatów obrazów, w tym zeskanowanych dokumentów, zdjęć i zrzutów ekranu.

Proszę pobierz pakiet lub zainstaluj API z PyPI, używając następującego polecenia pip w konsoli:

pip install aspose-ocr-python-net 

Konwertuj tekst obrazu na Word w Python

Możemy łatwo rozpoznać i odczytać tekst z obrazu i przekonwertować go na dokument Word. Wykonaj poniższe kroki, aby programowo wyodrębnić i edytować tekst z obrazów.

  1. Zainicjuj obiekt klasy OcrInput, podając jako argument opcję InputType.SINGLEIMAGE.
  2. Dodaj obraz za pomocą metody add().
  3. Utwórz instancję obiektu klasy AsposeOcr.
  4. Następnie wywołaj metodę rozpoznawania() z obiektem OcrInput jako argumentem.
  5. Na koniec zapisz wynik jako plik DOCX, używając metody save().

Poniższy przykładowy kod pokazuje, jak przekonwertować tekst obrazu na dokument programu Word w języku Python.

# Ten przykład kodu demonstruje, jak przekonwertować tekst obrazu na Word w Python!
import aspose.ocr as ocr

# Dodaj obraz do partii rozpoznawania
inputImg = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
inputImg.add("sample.jpg")

# Utwórz instancję API Aspose.OCR
api = ocr.AsposeOcr()

# Rozpoznaj obraz
result = api.recognize(inputImg)

# Wydrukuj wynik rozpoznania
print(result[0].recognition_text)
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX);
Konwerter tekstu obrazu na słowo w Python.

Konwerter tekstu obrazu na słowo w Python.

Tekst obrazu do programu Word — bezpłatne zasoby

Chcesz zrobić więcej z konwersją tekstu obrazu na Word w Python? Sprawdź poniższe zasoby, aby dowiedzieć się więcej o funkcjach biblioteki i zobaczyć, co jeszcze możesz zrobić!

Biblioteka Python OCR — uzyskaj bezpłatną licencję

Zacznij od bezpłatnej konwersji tekstu obrazu na Word! Odwiedź stronę „Licencja tymczasowa”, aby dowiedzieć się, jak łatwo uzyskać bezpłatną licencję tymczasową, która umożliwi Ci wypróbowanie biblioteki bez żadnych ograniczeń.

Wniosek

W tym poście na blogu omówiliśmy, jak konwertować tekst obrazu na edytowalne dokumenty programu Word. Wykorzystując Aspose.OCR for Python, możemy skutecznie wyodrębniać tekst z obrazów i konwertować go do formatu Word, oszczędzając czas i zwiększając produktywność. Biblioteka obsługuje ponad 100 języków i oferuje elastyczne opcje wyjściowe, co czyni ją popularnym wyborem dla programistów i firm chcących zautomatyzować zadania przetwarzania dokumentów. Wykonując czynności opisane w tym przewodniku, możesz programowo wyodrębniać tekst z obrazów, automatyzować zadania przetwarzania dokumentów, wyodrębniać dane ze zeskanowanych dokumentów i nie tylko. Zatem śmiało, wypróbuj i odblokuj potencjał konwersji obrazu na tekst w swoich projektach!

W przypadku jakichkolwiek niejasności prosimy o kontakt na naszym bezpłatnym forum pomocy technicznej.

Zobacz też