Es posible que se encuentre en escenarios en los que tenga que guardar el texto de los archivos de PowerPoint en una base de datos o en algún archivo. Hacer esta tarea manualmente llevará mucho tiempo y será menos eficiente. La mejor manera sería hacer la extracción mediante programación. Con ese fin, este artículo le enseñará cómo extraer texto de archivos de PowerPoint usando C++.
- API de C++ para extraer texto de archivos de PowerPoint
- Extraer texto de una diapositiva de PowerPoint usando C++
- Extraer texto de una presentación de PowerPoint usando C++
- Obtenga una licencia gratis
API de C++ para extraer texto de archivos de PowerPoint
Aspose.Slides for C++ es una biblioteca nativa de C++ que lo ayuda a automatizar sus tareas relacionadas con PowerPoint. La API admite la creación, lectura y modificación de presentaciones de PowerPoint. Además, la API también le brinda la capacidad de extraer texto de sus archivos de PowerPoint. Puede instalar la API a través de NuGet o descargarla directamente desde la sección Descargas.
PM> Install-Package Aspose.Slides.Cpp
Extraer texto de una diapositiva de PowerPoint usando C++
Los siguientes son los pasos para extraer texto de una diapositiva de PowerPoint.
- En primer lugar, cargue la presentación de PowerPoint utilizando la clase Presentation.
- Recupere los marcos de texto de la diapositiva usando SlideUtil::GetAllTextBoxes (System::SharedPtr diapositiva) método.
- Bucle a través de los marcos de texto.
- Dentro del ciclo, acceda a los párrafos usando el método ITextFrame->getParagraphs().
- Recorra los párrafos y acceda a las partes usando el método IParagraph->getPortions().
- Recupere el texto de cada porción usando el método IPortion->getText().
El siguiente es el código de muestra para extraer texto de una diapositiva de PowerPoint usando C++.
// Ejemplo de ruta de archivo
const String sourceFilePath = u"SourceDirectory\\SamplePresentation.pptx";
// Cargue el archivo de presentación
SharedPtr<Presentation> presentation = MakeObject<Presentation>(sourceFilePath);
// Obtenga una matriz de objetos ITextFrame de la primera diapositiva
System::ArrayPtr<SharedPtr<ITextFrame>> textFramesSlideOne = SlideUtil::GetAllTextBoxes(presentation->get_Slides()->idx_get(0));
// Bucle a través de la matriz de TextFrames
for (int i = 0; i < textFramesSlideOne->get_Length(); i++)
{
// Recorrer los párrafos en el ITextFrame actual
for (SharedPtr<IParagraph> paragraph : textFramesSlideOne[i]->get_Paragraphs())
{
// Bucle a través de porciones en el IParagraph actual
for (SharedPtr<IPortion> portion : paragraph->get_Portions())
{
// Mostrar texto
Console::WriteLine(portion->get_Text());
}
}
}
Extraer texto de una presentación de PowerPoint usando C++
Los siguientes son los pasos para extraer texto de una presentación de PowerPoint.
- En primer lugar, cargue la presentación de PowerPoint utilizando la clase Presentation.
- Recupere los marcos de texto de toda la presentación usando SlideUtil::GetAllTextFrames (System::SharedPtr pres, bool withMasters) método.
- Bucle a través de los marcos de texto.
- Dentro del ciclo, accede a los párrafos usando el método ITextFrame->getParagraphs().
- Recorra los párrafos y acceda a las partes usando el método IParagraph->getPortions().
- Recupere el texto de cada porción usando el método IPorción->getText().
El siguiente es el código de muestra para extraer texto de una presentación de PowerPoint usando C++.
// Ejemplo de ruta de archivo
const String sourceFilePath = u"SourceDirectory\\SamplePresentation.pptx";
// Cargue el archivo de presentación
SharedPtr<Presentation> presentation = MakeObject<Presentation>(sourceFilePath);
// Obtenga una matriz de objetos ITextFrame de todas las diapositivas en la presentación
System::ArrayPtr<SharedPtr<ITextFrame>> textFramesPresentation = SlideUtil::GetAllTextFrames(presentation, true);
// Bucle a través de la matriz de TextFrames
for (int i = 0; i < textFramesPresentation->get_Length(); i++)
{
// Recorrer los párrafos en el ITextFrame actual
for (SharedPtr<IParagraph> paragraph : textFramesPresentation[i]->get_Paragraphs())
{
// Bucle a través de porciones en el IParagraph actual
for (SharedPtr<IPortion> portion : paragraph->get_Portions())
{
// Mostrar texto
Console::WriteLine(portion->get_Text());
}
}
}
Obtenga una licencia gratis
Puede solicitar una licencia temporal gratuita para probar la API sin limitaciones de evaluación.
Conclusión
En este artículo, ha aprendido a extraer texto de archivos de PowerPoint utilizando C++. Específicamente, ha aprendido a extraer texto de una diapositiva de PowerPoint en particular o de una presentación de PowerPoint completa. Aspose.Slides for C++ proporciona un montón de características adicionales para trabajar con presentaciones. Puede explorar la API en detalle visitando la documentación oficial. Si tiene alguna pregunta, no dude en ponerse en contacto con nosotros en el foro de soporte gratuito.