Le format DjVu est utilisé pour stocker les documents numérisés car ils peuvent inclure du texte, des images ou des dessins. DjVu est utilisé pour archiver les données car il est capable de stocker les données en utilisant le minimum d’espace. Cet article explique comment reconnaître du texte à partir d’images DjVu avec des opérations OCR par programmation en C#.
- Reconnaissance de texte à partir d’une image DjVu - Installation de l’API C#
- Reconnaître du texte en effectuant une OCR sur une image DjVu en C#
Reconnaissance de texte à partir d’une image DjVu - Installation de l’API C#
L’API Aspose.OCR for .NET prend en charge la reconnaissance optique des caractères pour différents types de documents tels que JPG, PNG, PDF, etc. De même, elle prend également en charge la reconnaissance de texte à partir de fichiers image DjVu multipages. Vous pouvez facilement configurer l’API en téléchargeant le fichier JAR de l’API à partir de la section Téléchargements. De même, vous pouvez exécuter la commande d’installation NuGet suivante pour installer la bibliothèque dans votre projet :
PM> Install-Package Aspose.OCR
Reconnaître du texte en effectuant une OCR sur une image DjVu en C#
Vous pouvez reconnaître du texte en effectuant des opérations OCR sur des images DjVu de plusieurs pages en suivant les étapes ci-dessous :
- Initialisez une instance d’API à l’aide de la classe AsposeOCR.
- Créez un objet de classe DocumentRecognitionSettings.
- Reconnaître du texte à l’aide de la méthode RecognizeDjvu.
- Imprimer le texte reconnu.
L’exemple de code suivant montre comment reconnaître le texte d’une image DjVu en effectuant l’OCR par programmation en C# :
// Entrez le chemin du fichier image DJVU
string imgPath = "sample1.djvu";
// Initialiser l'objet de classe AsposeOcr
AsposeOcr api = new AsposeOcr();
// Reconnaître les images de DJVU
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.PagesNumber = 0;
List<Aspose.OCR.RecognitionResult> result = api.RecognizeDjvu(imgPath, set);
// Résultat d'impression
int pageNumber = 0;
foreach (var page in result)
{
System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}
Obtenez une licence API gratuite
Vous pouvez demander une Licence temporaire gratuite pour évaluer l’API sans aucune limitation d’évaluation.
Conclusion
En conclusion, vous avez appris à reconnaître du texte avec des opérations OCR sur une image DjVu multipage. Vous pouvez reconnaître du texte avec la possibilité de spécifier les paramètres de reconnaissance de document où vous pouvez définir des options de contraste automatique et d’inclinaison pour l’image d’entrée afin d’augmenter la précision du processus de reconnaissance de texte. De plus, vous pouvez explorer diverses autres fonctionnalités prises en charge par l’API en consultant la section documentation. Si vous avez besoin de discuter de l’une de vos préoccupations ou exigences, n’hésitez pas à nous écrire sur le forum.