PowerPoint 파일의 텍스트를 데이터베이스나 일부 파일에 저장해야 하는 경우가 있습니다. 이 작업을 수동으로 수행하면 시간이 많이 걸리고 효율성이 떨어집니다. 더 나은 방법은 프로그래밍 방식으로 추출을 수행하는 것입니다. 이를 위해 이 기사에서는 C++를 사용하여 PowerPoint 파일에서 텍스트를 추출하는 방법을 설명합니다.
- PowerPoint 파일에서 텍스트를 추출하는 C++ API
- C++를 사용하여 PowerPoint 슬라이드에서 텍스트 추출
- C++를 사용하여 PowerPoint 프레젠테이션에서 텍스트 추출
- 무료 라이선스 받기
PowerPoint 파일에서 텍스트를 추출하는 C++ API
Aspose.Slides for C++은 PowerPoint 관련 작업을 자동화하는 데 도움이 되는 기본 C++ 라이브러리입니다. API는 PowerPoint 프레젠테이션 작성, 읽기 및 수정을 지원합니다. 또한 API는 PowerPoint 파일에서 텍스트를 추출하는 기능도 제공합니다. NuGet을 통해 API를 설치하거나 다운로드 섹션에서 직접 다운로드할 수 있습니다.
PM> Install-Package Aspose.Slides.Cpp
C++를 사용하여 PowerPoint 슬라이드에서 텍스트 추출
다음은 PowerPoint 슬라이드에서 텍스트를 추출하는 단계입니다.
- 먼저 Presentation 클래스를 사용하여 PowerPoint 프레젠테이션을 로드합니다.
- SlideUtil::GetAllTextBoxes (System::SharedPtr 슬라이드) 방법.
- 텍스트 프레임을 반복합니다.
- 루프 내에서 ITextFrame->getParagraphs() 메서드를 사용하여 단락에 액세스합니다.
- 단락을 반복하고 IParagraph->getPortions() 메서드를 사용하여 해당 부분에 액세스합니다.
- IPortion->getText() 메서드를 사용하여 각 부분에서 텍스트를 검색합니다.
다음은 C++를 사용하여 PowerPoint 슬라이드에서 텍스트를 추출하는 샘플 코드입니다.
// 샘플 파일 경로
const String sourceFilePath = u"SourceDirectory\\SamplePresentation.pptx";
// 프레젠테이션 파일 로드
SharedPtr<Presentation> presentation = MakeObject<Presentation>(sourceFilePath);
// 첫 번째 슬라이드에서 ITextFrame 개체의 배열 가져오기
System::ArrayPtr<SharedPtr<ITextFrame>> textFramesSlideOne = SlideUtil::GetAllTextBoxes(presentation->get_Slides()->idx_get(0));
// TextFrames 배열을 통해 루프
for (int i = 0; i < textFramesSlideOne->get_Length(); i++)
{
// 현재 ITextFrame의 단락 반복
for (SharedPtr<IParagraph> paragraph : textFramesSlideOne[i]->get_Paragraphs())
{
// 현재 Iparagraph의 부분을 통해 루프
for (SharedPtr<IPortion> portion : paragraph->get_Portions())
{
// 텍스트 표시
Console::WriteLine(portion->get_Text());
}
}
}
C++를 사용하여 PowerPoint 프레젠테이션에서 텍스트 추출
다음은 PowerPoint 프레젠테이션에서 텍스트를 추출하는 단계입니다.
- 먼저 Presentation 클래스를 사용하여 PowerPoint 프레젠테이션을 로드합니다.
- SlideUtil::GetAllTextFrames (System::SharedPtr pres, bool withMasters) 메서드.
- 텍스트 프레임을 반복합니다.
- 루프 내에서 ITextFrame->getParagraphs() 메서드를 사용하여 단락에 액세스합니다.
- 단락을 반복하고 IParagraph->getPortions() 메서드를 사용하여 해당 부분에 액세스합니다.
- IPortion->getText() 메서드를 사용하여 각 부분에서 텍스트를 검색합니다.
다음은 C++를 사용하여 PowerPoint 프레젠테이션에서 텍스트를 추출하는 샘플 코드입니다.
// 샘플 파일 경로
const String sourceFilePath = u"SourceDirectory\\SamplePresentation.pptx";
// 프레젠테이션 파일 로드
SharedPtr<Presentation> presentation = MakeObject<Presentation>(sourceFilePath);
// 프레젠테이션의 모든 슬라이드에서 ITextFrame 개체의 배열 가져오기
System::ArrayPtr<SharedPtr<ITextFrame>> textFramesPresentation = SlideUtil::GetAllTextFrames(presentation, true);
// TextFrames 배열을 통해 루프
for (int i = 0; i < textFramesPresentation->get_Length(); i++)
{
// 현재 ITextFrame의 단락 반복
for (SharedPtr<IParagraph> paragraph : textFramesPresentation[i]->get_Paragraphs())
{
// 현재 Iparagraph의 부분을 통해 루프
for (SharedPtr<IPortion> portion : paragraph->get_Portions())
{
// 텍스트 표시
Console::WriteLine(portion->get_Text());
}
}
}
무료 라이선스 받기
임시 무료 라이선스를 요청하여 평가 제한 없이 API를 사용해 볼 수 있습니다.
결론
이 기사에서는 C++를 사용하여 PowerPoint 파일에서 텍스트를 추출하는 방법을 배웠습니다. 특히, 특정 PowerPoint 슬라이드 또는 전체 PowerPoint 프레젠테이션에서 텍스트를 추출하는 방법을 배웠습니다. C++용 Aspose.Slides는 프레젠테이션 작업을 위한 다양한 추가 기능을 제공합니다. API에 대한 자세한 내용은 공식 문서에서 확인할 수 있습니다. 질문이 있는 경우 무료 지원 포럼에 문의해 주십시오.