Python busca y reemplaza texto en PDF

Si está buscando una forma simple pero precisa de encontrar y reemplazar texto en archivos PDF, ha venido al lugar correcto. En este artículo, aprenderá cómo reemplazar un texto en particular en un PDF usando Python. Al escribir unas pocas líneas de código, puede analizar todo el PDF para buscar y reemplazar las palabras/frases deseadas.

Biblioteca de Python para buscar y reemplazar texto en PDF

Para buscar y reemplazar texto en archivos PDF, usaremos Aspose.PDF for Python. Es una biblioteca robusta de Python para crear y procesar archivos PDF sin esfuerzo. La biblioteca también le permite buscar y reemplazar texto en archivos PDF con alta precisión y velocidad.

Para instalar la biblioteca, puede usar el siguiente comando pip.

> pip install aspose-pdf

Buscar y reemplazar texto en PDF usando Python

Los siguientes pasos explican cómo buscar y reemplazar texto en un documento PDF usando Python con la ayuda de Aspose.PDF.

  1. Cargue el PDF desde su ruta usando la clase Document.
  2. Cree una instancia de la clase TextFragmentAbsorber y proporcione la frase de búsqueda a su constructor.
  3. Acepte el absorbente de texto para todas las páginas del PDF usando doc.pages.accept(textabsorber).
  4. Obtenga los fragmentos de texto extraídos en un objeto.
  5. Recorra los fragmentos de texto encontrados y reemplace el texto en cada fragmento.
  6. Finalmente, guarde el documento PDF actualizado usando el método Document.save().

El siguiente ejemplo de código muestra cómo buscar y reemplazar texto en PDF usando Python.

# Cargue el documento PDF
document = ap.Document("input.pdf")

# Crear una instancia de un objeto TextFragmentAbsorber
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# Buscar texto
document.pages.accept(txtAbsorber)

# Obtener referencia a los fragmentos de texto encontrados
textFragmentCollection = txtAbsorber.text_fragments

# Analice todos los fragmentos de texto buscados y reemplace el texto
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# Guardar el PDF actualizado
document.save("output.pdf")

Herramienta en línea para reemplazar texto en PDF

También hemos desarrollado una herramienta en línea para reemplazar texto en archivos PDF, que se basa en Aspose.PDF for Python. Puede usar esta herramienta desde cualquier lugar en cualquier momento solo con una conexión a Internet.

Biblioteca gratuita de Python para reemplazar texto en PDF

Puede obtener una licencia temporal gratuita y reemplazar texto en archivos PDF sin ninguna limitación.

Además, puede explorar otras funciones de la biblioteca PDF de Python utilizando la documentación. Además, escríbanos en nuestro foro sobre sus problemas, sugerencias o comentarios.

Conclusión

En este artículo, ha aprendido cómo analizar un PDF y buscar y reemplazar un texto en particular usando Python. En unas pocas líneas de código, puede buscar y reemplazar texto en un lote de archivos PDF. Además, le proporcionamos una herramienta en línea gratuita para reemplazar texto en archivos PDF. Puede utilizar esta herramienta desde cualquier dispositivo que tenga conexión a Internet.

Ver también