스캔한 PDF 파일에는 이미지 형식의 데이터가 포함되어 있으며 이러한 문서의 정보가 필요할 수 있습니다. 특정 상황에서 스캔한 PDF 파일에는 Excel에서 조작해야 할 수 있는 숫자 정보가 포함될 수 있습니다. 이에 따라 OCR 작업을 수행하고 Excel 파일을 만들 수 있습니다. 이 문서에서는 C#을 사용하여 프로그래밍 방식으로 OCR 기능을 사용하여 스캔한 PDF를 Excel로 변환기를 만드는 방법을 다룹니다.
OCR을 사용하여 스캔한 PDF를 Excel 변환기로 만들기 – C# API 설치
Aspose.OCR for .NET API에서 제공하는 OCR 기능으로 작업할 수 있습니다. New Releases 섹션에서 DLL 파일을 다운로드하거나 아래의 NuGet 설치 명령을 사용하여 OCR을 사용하여 스캔한 PDF를 Excel로 변환하는 변환기를 쉽게 만들 수 있습니다.
PM> Install-Package Aspose.OCR
C#에서 프로그래밍 방식으로 스캔한 PDF를 Excel로 변환
아래 단계에 따라 스캔한 PDF 문서를 OCR을 사용하여 Excel 파일로 변환할 수 있습니다.
- AsposeOcr 클래스 개체를 인스턴스화합니다.
- DocumentRecognitionSettings 클래스 개체를 지정합니다.
- RecognizePdf 방식으로 스캔한 PDF 파일을 인식합니다.
- SaveMultipageDocument 메서드를 사용하여 출력된 Excel 파일을 저장합니다.
다음 코드 샘플은 C#을 사용하여 스캔한 PDF를 Excel로 변환하는 방법을 설명합니다.
// 스캔한 PDF 파일 경로
string path = "Scanned.pdf";
// AsposeOcr 호출 개체 초기화
AsposeOcr api = new AsposeOcr();
// PDF 파일 인식을 위한 설정 지정
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;
// 스캔한 PDF 파일에서 페이지 인식
List<RecognitionResult> res = api.RecognizePdf(path , settings);
// 출력 결과를 XLSX 형식의 Excel 파일로 저장
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);
무료 평가판 라이선스 받기
임시 무료 라이선스를 요청하면 스캔한 PDF를 Excel로 변환하는 기능을 평가할 수 있습니다.
결론
이 기사에서는 텍스트를 광학적으로 인식하는 OCR 연산을 적용하여 스캔한 PDF 파일을 Excel로 변환하는 방법을 확인했습니다. 이는 CSV 파일이 스캐너로 스캔되고 PDF 파일이 생성되는 경우와 같은 시나리오에서 유용할 수 있습니다. C#을 사용하여 프로그래밍 방식으로 Excel 파일로 변환할 수 있습니다. 또한 문서를 통해 API에서 제공하는 다른 OCR 관련 기능을 살펴볼 수 있습니다. 문의사항이 있으시면 포럼으로 연락주시기 바랍니다.