Convertir PDF a Excel en JavaScript

En el mundo de la gestión de datos, convertir información de un formato a otro es una necesidad común. Una de esas transformaciones que surge con frecuencia es la conversión de datos de un documento PDF a una hoja de cálculo de Excel. Los desarrolladores de JavaScript que buscan una solución confiable y eficiente para esta tarea pueden recurrir a Aspose.PDF for JavaScript, una potente biblioteca que facilita la manipulación de PDF sin problemas. En esta publicación de blog, exploraremos el proceso de conversión de PDF a Excel en aplicaciones JavaScript.

Biblioteca JavaScript para convertir PDF a Excel

Para convertir archivos PDF a hojas de Excel, usaremos Aspose.PDF for JavaScript. Es una biblioteca rica en funciones que permite a los desarrolladores trabajar con documentos PDF mediante programación. Le permite generar, procesar y convertir archivos PDF sin esfuerzo.

Descargue la biblioteca y siga las instrucciones de instalación que se proporcionan aquí: Cómo instalar Aspose.PDF for JavaScript.

Convierta un PDF a Excel XLSX en JavaScript

Es un proceso sencillo convertir un PDF a formato Excel usando Aspose.PDF for JavaScript. Simplemente cargue el archivo y llame a la función de conversión. Sin embargo, para evitar el bloqueo del hilo principal de la interfaz de usuario, escribiremos un trabajador web para facilitar el proceso de conversión de archivos PDF y descarga de archivos de Excel.

Entonces, conviertamos un PDF a Excel XLSX paso a paso en JavaScript.

  1. Utilice el siguiente fragmento de código para crear un trabajador web.
/*Create Web Worker*/
const AsposePDFWebWorker = new Worker("AsposePDFforJS.js");
AsposePDFWebWorker.onerror = evt => console.log(`Error from Web Worker: ${evt.message}`);
AsposePDFWebWorker.onmessage = evt => document.getElementById('output').textContent = 
  (evt.data == 'ready') ? 'loaded!' :
    (evt.data.json.errorCode == 0) ? `Result:\n${DownloadFile(evt.data.json.fileNameResult, "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet", evt.data.params[0])}` : `Error: ${evt.data.json.errorText}`;

/*Event handler*/
const ffileToXlsX = e => {
  const file_reader = new FileReader();
  file_reader.onload = event => {
    /*convert a PDF-file to XlsX and save the "ResultPDFtoXlsX.xlsx" - Ask Web Worker*/
    AsposePDFWebWorker.postMessage({ "operation": 'AsposePdfToXlsX', "params": [event.target.result, e.target.files[0].name, "ResultPDFtoXlsX.xlsx"] }, [event.target.result]);
  };
  file_reader.readAsArrayBuffer(e.target.files[0]);
};
/// [Fragmento de código]

/*make a link to download the result file*/
const DownloadFile = (filename, mime, content) => {
    mime = mime || "application/octet-stream";
    var link = document.createElement("a"); 
    link.href = URL.createObjectURL(new Blob([content], {type: mime}));
    link.download = filename;
    link.innerHTML = "Click here to download the file " + filename;
    document.body.appendChild(link); 
    document.body.appendChild(document.createElement("br"));
    return filename;
  }
  1. Siga los pasos a continuación para convertir un archivo PDF a Excel.
  • Primero, debemos seleccionar el PDF que se convertirá al formato Excel XLSX.
  • Luego, crearemos un nuevo objeto FileReader.
  • Después de eso, llamaremos a la función AsposePdfToXlsX que convierte PDF a hoja de cálculo Excel XLSX.
  • La función AsposePdfToXlsX responde con un objeto JSON. Si obtenemos json.errorCode como 0, el archivo de Excel se convierte correctamente. De lo contrario, hay un error en nuestro archivo y podemos recibir el mensaje de error en json.errorText.
  • Al final, llamaremos a la función DownloadFile que genera un enlace para descargar el archivo de Excel convertido.

El siguiente es el código para convertir un PDF a Excel XLSX en JavaScript.

var ffileToXlsX = function (e) {
  const file_reader = new FileReader();
  file_reader.onload = (event) => {
    
    /*convert a PDF-file to XlsX and save the "ResultPDFtoXlsX.xlsx"*/
    const json = AsposePdfToXlsX(event.target.result, e.target.files[0].name, "ResultPDFtoXlsX.xlsx");
    if (json.errorCode == 0) document.getElementById('output').textContent = json.fileNameResult;
    else document.getElementById('output').textContent = json.errorText;
    
    /*make a link to download the result file*/
    DownloadFile(json.fileNameResult, "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet");
  }
  file_reader.readAsArrayBuffer(e.target.files[0]);
}

Obtenga una biblioteca PDF de JavaScript gratuita

Obtenga una licencia temporal gratuita y utilice nuestra biblioteca PDF de JavaScript sin limitaciones.

Convertidor gratuito de PDF a Excel

También puede explorar y utilizar nuestro conversor de PDF a Excel en línea, que se basa en Aspose.PDF for JavaScript. Esta es una herramienta gratuita y no es necesario crear una cuenta ni proporcionar datos de tarjeta de crédito.

Conclusión

Convertir archivos PDF a hojas de cálculo de Excel es una necesidad común en las aplicaciones web basadas en datos, y Aspose.PDF for JavaScript simplifica esta tarea con su API potente y fácil de usar. Al integrar perfectamente la biblioteca en proyectos de JavaScript, los desarrolladores pueden extraer datos de documentos PDF de manera eficiente y transformarlos en hojas de cálculo de Excel.

Aspose.PDF for JavaScript no solo agiliza el proceso de conversión, sino que también ofrece opciones de personalización avanzadas, brindando a los desarrolladores las herramientas que necesitan para manejar diversas estructuras de PDF y cumplir con los requisitos específicos del proyecto. Explore más sobre la biblioteca en documentación. En caso de que tenga alguna consulta, compártala con nosotros a través de nuestro foro.

Ver también