PDF es un formato popular para compartir información a través de Internet. La mayoría de las veces, los archivos PDF contienen imágenes junto con texto y otros elementos. Puede haber escenarios en los que necesite extraer estas imágenes de archivos PDF para procesarlas más. Con ese fin, este artículo le enseñará cómo extraer imágenes de archivos PDF usando C++.

API de C++ para extraer imágenes de archivos PDF

Aspose.PDF for C++ es una biblioteca de C++ que le permite crear, leer y modificar documentos PDF. Además, la API admite la extracción de imágenes de archivos PDF. Puede instalar la API a través de NuGet o descargarla directamente desde la sección descargas.

PM> Install-Package Aspose.PDF.Cpp

Extrae imágenes de archivos PDF usando C++

Los siguientes son los pasos para extraer imágenes de un archivo PDF.

  • Cargue el documento PDF usando la clase Document.
  • Obtenga las páginas del documento usando el método Document->get_Pages() e itere sobre ellas.
  • Obtenga imágenes para cada página usando el método page->get_Resources()->get_Images() e itere sobre ellas.
  • Cree un objeto FileStream para cada imagen y guárdelo como JPEG, PNG, etc.

El siguiente código de ejemplo muestra cómo extraer imágenes de un archivo PDF mediante C++.

// Cargue el documento PDF
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\PDF\\SampleImages2.pdf");

// Inicializar el contador de imágenes
int imageCounter = 1;

// Iterar a través de las páginas del documento.
for (auto page : pdfDocument->get_Pages())
{
	// Iterar a través de las imágenes de la página.
	for (auto image : page->get_Resources()->get_Images())
	{
		// Crear una instancia de FileStream
		System::SharedPtr<System::IO::FileStream> outputImage = System::IO::File::Create(String::Format(u"OutputDirectory\\Image{0}.jpg", imageCounter));

		// Guarda la imagen
		image->Save(outputImage, System::Drawing::Imaging::ImageFormat::get_Jpeg());

		// Cerrar FileStream
		outputImage->Close();

		// Incrementar el contador de imágenes
		imageCounter++;
	}
}

Obtenga una licencia gratis

Puede probar la API sin limitaciones de evaluación solicitando una licencia temporal gratuita.

Conclusión

En este artículo, ha aprendido a extraer imágenes de archivos PDF utilizando C++. Usamos la robusta y fácil de usar Aspose.PDF for C++ para lograr esto. La API proporciona un montón de funciones adicionales para trabajar con archivos PDF que puede explorar en detalle visitando la documentación oficial. Si tiene alguna pregunta sobre cualquier aspecto de la API, no dude en comunicarse con nosotros en nuestro foro de soporte gratuito.

Ver también