Gescanntes PDF zu Excel OCR

Gescannte PDF-Dateien enthalten Daten im Bildformat und manchmal benötigen Sie möglicherweise Informationen aus solchen Dokumenten. In bestimmten Situationen kann eine gescannte PDF-Datei numerische Informationen enthalten, die möglicherweise in Excel bearbeitet werden müssen. Dementsprechend können Sie OCR-Operationen durchführen und eine Excel-Datei erstellen. In diesem Artikel wird beschrieben, wie Sie einen gescannten PDF-zu-Excel-Konverter mit OCR-Funktion programmgesteuert mit C# erstellen.

Gescannten PDF-zu-Excel-Konverter mit OCR erstellen – C#-API-Installation

Sie können mit OCR-Funktionen arbeiten, die von der API Aspose.OCR for .NET angeboten werden. Sie können ganz einfach einen gescannten PDF-zu-Excel-Konverter mit OCR erstellen, indem Sie die DLL-Datei aus dem Abschnitt Neue Versionen herunterladen oder den NuGet-Installationsbefehl unten verwenden:

PM> Install-Package Aspose.OCR

Konvertieren Sie gescannte PDF-Dateien programmgesteuert in C# in Excel

Sie können ein gescanntes PDF-Dokument mit OCR in eine Excel-Datei konvertieren, indem Sie die folgenden Schritte ausführen:

  1. Instanziieren Sie das Klassenobjekt AsposeOcr.
  2. Geben Sie ein DocumentRecognitionSettings-Klassenobjekt an.
  3. Erkennen Sie die gescannte PDF-Datei mit der Methode RecognizePdf.
  4. Speichern Sie die Excel-Ausgabedatei mit der Methode SaveMultipageDocument.

Das folgende Codebeispiel erläutert, wie Sie eine gescannte PDF-Datei mit C# in Excel konvertieren:

// Pfad der gescannten PDF-Datei
string path = "Scanned.pdf";

// AsposeOcr-Calss-Objekt initialisieren
AsposeOcr api = new AsposeOcr();

// Legen Sie die Einstellungen zum Erkennen von PDF-Dateien fest
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;

// Erkennen Sie Seiten aus gescannten PDF-Dateien
List<RecognitionResult> res = api.RecognizePdf(path , settings);

// Speichern Sie das Ausgabeergebnis als Excel-Datei im XLSX-Format
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);

Holen Sie sich eine kostenlose Evaluierungslizenz

Sie können die Funktion zum Konvertieren gescannter PDFs in Excel in vollem Umfang testen, indem Sie eine kostenlose temporäre Lizenz anfordern.

Fazit

In diesem Artikel haben Sie überprüft, wie Sie eine gescannte PDF-Datei in Excel konvertieren, indem Sie OCR-Operationen anwenden, um den Text optisch zu erkennen. Dies kann beispielsweise hilfreich sein, wenn eine CSV-Datei von einem Scanner gescannt und eine PDF-Datei erstellt wird. Sie können es programmgesteuert mit C# in eine Excel-Datei konvertieren. Darüber hinaus können Sie einen Blick auf andere OCR-bezogene Funktionen werfen, die von der API angeboten werden, indem Sie die Dokumentation durchgehen. Bei Fragen können Sie sich gerne im Forum an uns wenden.

Siehe auch