이 블로그 게시물에서는 Java로 문서 스캔을 탐색합니다. 문서 관리 시스템, 모바일 앱 또는 OCR(광학 문자 인식), OMR(광학 마크 인식) 애플리케이션을 구축하든 관계없이 이 가이드는 Java를 사용하여 문서 스캔을 구현하는 데 필요한 정보를 제공합니다.
Java 문서 스캔 API
Java로 문서를 스캔하면 실제 문서를 디지털 형식으로 원활하게 변환할 수 있습니다. 향상된 문서 관리, 더 쉬운 공유 및 저장, 향상된 검색 기능, 종이 정리 감소 등 다양한 이점을 제공합니다. Java의 교차 플랫폼 호환성 및 지원은 문서 스캐닝 기능을 구현하기 위한 탁월한 선택입니다.
Java에서 OCR 문서 스캐닝
OCR은 컴퓨터가 이미지 또는 스캔한 문서에서 텍스트를 인식하고 추출할 수 있도록 하는 기술입니다. Java용 Aspose.OCR을 사용하면 OCR 기능을 Java 애플리케이션에 통합하여 다양한 소스에서 텍스트를 쉽게 추출하고 프로그램에서 사용할 수 있습니다.
또한 27개의 라틴어 및 키릴 문자와 중국어를 지원합니다. OCR API는 스캔한 이미지, 스마트폰 사진, 스크린샷, 이미지의 특정 영역, 스캔한 PDF 등 다양한 유형의 입력을 인식할 수 있습니다.
다음은 문서 스캔과 관련된 Aspose.OCR의 몇 가지 중요한 기능 목록입니다.
- 텍스트 추출: 이미지, 스캔한 파일 또는 PDF 문서에서 텍스트를 인식하고 추출합니다.
- 언어 지원: 영어, 스페인어, 프랑스어, 독일어 등과 같은 다양한 언어로 된 텍스트를 추출하기 위해 여러 언어를 지원합니다.
- 고급 OCR 알고리즘: 고급 OCR 알고리즘을 활용하여 정확하고 신뢰할 수 있는 텍스트 추출을 제공합니다.
- 전처리 옵션: 노이즈 제거, 기울기 보정 등의 이미지 필터를 적용하여 입력 이미지의 품질을 향상시킵니다.
- 손쉬운 통합: Java 애플리케이션에 쉽게 통합되도록 설계되었습니다.
- 링크 스캐닝: 웹 링크로 제공되는 이미지를 인식합니다.
- 일괄 스캔: 한 번의 호출로 여러 이미지를 인식하는 다양한 일괄 처리 방법을 제공합니다.
- 그리고 훨씬 더…
다음 리소스를 추가로 탐색하여 Java 문서 스캐닝 API를 배울 수 있습니다.
또한 OCR 기능이 있는 문서 스캐너 응용 프로그램을 만들기 위해 다음 코드 스니펫을 끝에서 시도할 수 있습니다.
// 이 코드 예제는 인식된 텍스트를 철자 교정과 함께 저장하는 방법을 보여줍니다.
// 인식할 이미지 경로
String imagePath = "C:\\Files\\sample.jpg";
String resultPath = "C:\\Files\\MyResult.txt";
// OCR API 생성
AsposeOCR api = new AsposeOCR();
// 인식 설정 초기화
RecognitionSettings settings = new RecognitionSettings();
// 이미지에서 텍스트 인식
RecognitionResult result = api.RecognizePage(imagePath, new RecognitionSettings());
// 수정된 텍스트 저장
result.saveSpellCheckCorrectedText(resultPath, Format.Text, SpellCheckLanguage.Eng);
Java에서 OMR 문서 스캔
종이 기반 양식, 설문 조사 및 평가에서 데이터를 추출하고 수집하는 것은 시간이 많이 걸리고 오류가 발생하기 쉬운 작업이 될 수 있습니다. Aspose.OMR for Java를 사용하여 스캔한 문서에서 정보를 추출하는 프로세스를 단순화할 수 있습니다.
Aspose.OMR for Java는 OMR 시트의 구조와 레이아웃을 정의하는 맞춤형 OMR 템플릿을 만드는 데 사용할 수 있습니다. 마찬가지로 추출된 데이터를 내보내는 유연한 옵션이 포함되어 있습니다. CSV, XML, JSON 등 다양한 형식으로 데이터를 저장할 수 있어 다양한 시스템 및 애플리케이션과 호환됩니다.
다음은 Aspose.OMR for Java의 문서 스캔 특성 중 일부입니다.
- 마크 인식: 확인란, 거품 또는 음영 영역과 같은 양식에 만들어진 마크를 정확하게 감지하고 인식하는 기능입니다.
- 템플릿 생성: 질문 배치, 답변 선택 및 기타 요소를 포함하여 양식의 전망을 정의하는 사용자 정의 가능한 템플릿을 생성합니다.
- 정확도 및 검증: 마크 감지 및 인식에서 높은 정확도를 보장하는 알고리즘 및 메커니즘.
- 스캔 이미지 수정: 회전 및 원근(측면 보기) 이미지를 처리하는 기능.
- 그리고 훨씬 더…
또한 Java의 문서 스캔에 대한 자세한 내용은 다음 리소스를 참조하십시오.
또한 Java를 사용하여 OMR 기능이 있는 문서 스캐너를 만들려면 다음 코드 스니펫을 사용할 수 있습니다.
// 이 코드 예제는 이미지에서 OMR을 수행하고 데이터를 추출하는 방법을 보여줍니다.
// OMR 템플릿 파일 경로
String templatePath = "C:\\Files\\OMR\\Sheet.omr";
// 이미지 파일 경로
String imagePath = "C:\\Files\\OMR\\Sheet1.png";
// OMR 엔진 초기화
OmrEngine engine = new OmrEngine();
// 템플릿 프로세서 가져오기
TemplateProcessor templateProcessor = engine.getTemplateProcessor(templatePath);
// 이미지 인식
RecognitionResult result = templateProcessor.recognizeImage(imagePath);
// CSV로 결과 얻기
String csvResult = result.getCsv();
// CSV 파일 저장
PrintWriter wr = new PrintWriter(new FileOutputStream("C:\\Files\\OMR\\Sheet1.csv"), true);
wr.println(csvResult);
합산
Java의 문서 스캐닝은 스캔한 문서를 처리하는 강력한 애플리케이션을 구축할 수 있는 가능성을 열어줍니다. 문서를 디지털화하면 시간과 리소스를 절약할 수 있을 뿐만 아니라 향상된 문서 관리 기능을 통해 Java로 프로젝트를 위한 보다 능률적이고 효율적인 워크플로를 위한 길을 열 수 있습니다.