Naskenované PDF do Excelu OCR

Naskenované soubory PDF obsahují data v obrazovém formátu a někdy můžete potřebovat informace z takových dokumentů. V určitých situacích může naskenovaný soubor PDF obsahovat číselné informace, se kterými může být nutné v Excelu manipulovat. V souladu s tím můžete provádět operace OCR a vytvářet soubor Excel. Tento článek popisuje, jak vytvořit naskenovaný převodník PDF do Excelu s funkcí OCR programově pomocí C#.

Vytvořte naskenovaný převodník PDF do Excelu s OCR – instalace C# API

Můžete pracovat s funkcemi OCR, které nabízí Aspose.OCR for .NET API. Naskenovaný převodník PDF do Excelu můžete snadno vytvořit pomocí OCR stažením souboru DLL ze sekce Nové verze nebo pomocí instalačního příkazu NuGet níže:

PM> Install-Package Aspose.OCR

Převeďte naskenované PDF do Excelu programově v C#

Naskenovaný dokument PDF můžete převést na soubor aplikace Excel pomocí OCR podle následujících kroků:

  1. Vytvořte instanci objektu třídy AsposeOcr.
  2. Zadejte objekt třídy DocumentRecognitionSettings.
  3. Rozpoznejte naskenovaný soubor PDF metodou RecognizePdf.
  4. Uložte výstupní soubor Excel pomocí metody SaveMultipageDocument.

Následující ukázka kódu vysvětluje, jak převést naskenovaný PDF do Excelu pomocí C#:

// Cesta k naskenovanému souboru PDF
string path = "Scanned.pdf";

// Inicializujte objekt calss AsposeOcr
AsposeOcr api = new AsposeOcr();

// Zadejte nastavení pro rozpoznávání souboru PDF
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;

// Rozpoznejte stránky z naskenovaného souboru PDF
List<RecognitionResult> res = api.RecognizePdf(path , settings);

// Uložte výsledek výstupu jako soubor aplikace Excel ve formátu XLSX
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);

Získejte bezplatnou zkušební licenci

Funkci převodu naskenovaného PDF do Excelu v plném rozsahu můžete vyhodnotit žádostí o bezplatnou dočasnou licenci.

Závěr

V tomto článku jste zkontrolovali, jak převést naskenovaný soubor PDF do aplikace Excel použitím operací OCR k optickému rozpoznání textu. To může být užitečné ve scénářích, jako když je soubor CSV naskenován skenerem a je vytvořen soubor PDF. Můžete jej převést na soubor aplikace Excel programově pomocí C#. Kromě toho se můžete podívat na další funkce související s OCR, které API nabízí, v dokumentaci. V případě jakýchkoliv dotazů nás neváhejte kontaktovat na fóru.

Viz také