PDF numérisé vers Excel OCR

Les fichiers PDF numérisés contiennent des données au format image et vous pouvez parfois avoir besoin d’informations provenant de ces documents. Dans certaines situations, un fichier PDF numérisé peut contenir des informations numériques qui peuvent devoir être manipulées dans Excel. Conformément à cela, vous pouvez effectuer des opérations OCR et créer un fichier Excel. Cet article explique comment créer un convertisseur PDF vers Excel numérisé avec la fonction OCR par programmation à l’aide de C#.

Créer un convertisseur PDF numérisé vers Excel avec OCR - Installation de l’API C#

Vous pouvez utiliser les fonctionnalités OCR proposées par l’API Aspose.OCR for .NET. Vous pouvez facilement créer un convertisseur PDF numérisé vers Excel avec OCR en téléchargeant le fichier DLL à partir de la section Nouvelles versions ou avec la commande d’installation NuGet ci-dessous :

PM> Install-Package Aspose.OCR

Convertir un PDF numérisé en Excel par programmation en C#

Vous pouvez convertir un document PDF numérisé en fichier Excel avec OCR en suivant les étapes ci-dessous :

  1. Instanciez l’objet de classe AsposeOcr.
  2. Spécifiez un objet de classe DocumentRecognitionSettings.
  3. Reconnaître le fichier PDF numérisé avec la méthode RecognizePdf.
  4. Enregistrez le fichier Excel de sortie à l’aide de la méthode SaveMultipageDocument.

L’exemple de code suivant explique comment convertir un PDF numérisé en Excel à l’aide de C# :

// Chemin d'accès au fichier PDF numérisé
string path = "Scanned.pdf";

// Initialiser l'objet calss AsposeOcr
AsposeOcr api = new AsposeOcr();

// Spécifiez les paramètres de reconnaissance du fichier PDF
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;

// Reconnaître les pages d'un fichier PDF numérisé
List<RecognitionResult> res = api.RecognizePdf(path , settings);

// Enregistrez le résultat de sortie sous forme de fichier Excel au format XLSX
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);

Obtenez une licence d’évaluation gratuite

Vous pouvez évaluer la fonctionnalité de conversion de PDF numérisé en Excel dans toute sa capacité en demandant une licence temporaire gratuite.

Conclusion

Dans cet article, vous avez vérifié comment convertir un fichier PDF numérisé en Excel en appliquant des opérations OCR pour reconnaître le texte optiquement. Cela peut être utile dans des scénarios comme lorsqu’un fichier CSV est numérisé par un scanner et qu’un fichier PDF est produit. Vous pouvez le convertir en fichier Excel par programmation à l’aide de C#. De plus, vous pouvez jeter un œil aux autres fonctionnalités liées à l’OCR offertes par l’API en parcourant la documentation. En cas de questions, n’hésitez pas à nous contacter sur le forum.

Voir également