在 JavaScript 中将 PDF 转换为 Excel

在数据管理领域,将信息从一种格式转换为另一种格式是一种常见的需要。经常出现的一种转换是将数据从 PDF 文档转换为 Excel 电子表格。正在寻找可靠且高效的解决方案来完成此任务的 JavaScript 开发人员可以求助于 Aspose.PDF for JavaScript,这是一个功能强大的库,可促进无缝 PDF 操作。在这篇博文中,我们将探讨在 JavaScript 应用程序中将 PDF 转换为 Excel 的过程。

将 PDF 转换为 Excel 的 JavaScript 库

要将 PDF 文件转换为 Excel 工作表,我们将使用 Aspose.PDF for JavaScript。它是一个功能丰富的库,使开发人员能够以编程方式处理 PDF 文档。它允许您轻松生成、处理和转换 PDF 文件。

下载 该库并按照此处提供的安装说明进行操作:如何安装 Aspose.PDF for JavaScript

在 JavaScript 中将 PDF 转换为 Excel XLSX

使用 Aspose.PDF for JavaScript 将 PDF 转换为 Excel 格式是一个简单的过程。只需加载文件并调用转换函数即可。但是,为了防止阻塞主 UI 线程,我们将编写一个 Web Worker 来使转换 PDF 和下载 Excel 文件的过程更加顺畅。

那么让我们在 JavaScript 中逐步将 PDF 转换为 Excel XLSX。

  1. 使用以下代码片段创建 Web Worker。
/*Create Web Worker*/
const AsposePDFWebWorker = new Worker("AsposePDFforJS.js");
AsposePDFWebWorker.onerror = evt => console.log(`Error from Web Worker: ${evt.message}`);
AsposePDFWebWorker.onmessage = evt => document.getElementById('output').textContent = 
  (evt.data == 'ready') ? 'loaded!' :
    (evt.data.json.errorCode == 0) ? `Result:\n${DownloadFile(evt.data.json.fileNameResult, "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet", evt.data.params[0])}` : `Error: ${evt.data.json.errorText}`;

/*Event handler*/
const ffileToXlsX = e => {
  const file_reader = new FileReader();
  file_reader.onload = event => {
    /*convert a PDF-file to XlsX and save the "ResultPDFtoXlsX.xlsx" - Ask Web Worker*/
    AsposePDFWebWorker.postMessage({ "operation": 'AsposePdfToXlsX', "params": [event.target.result, e.target.files[0].name, "ResultPDFtoXlsX.xlsx"] }, [event.target.result]);
  };
  file_reader.readAsArrayBuffer(e.target.files[0]);
};
/// [代码片段]

/*make a link to download the result file*/
const DownloadFile = (filename, mime, content) => {
    mime = mime || "application/octet-stream";
    var link = document.createElement("a"); 
    link.href = URL.createObjectURL(new Blob([content], {type: mime}));
    link.download = filename;
    link.innerHTML = "Click here to download the file " + filename;
    document.body.appendChild(link); 
    document.body.appendChild(document.createElement("br"));
    return filename;
  }
  1. 请按照以下步骤将 PDF 转换为 Excel 文件。
  • 首先,我们需要选择要转换为Excel XLSX格式的PDF。
  • 然后,我们将创建一个新的 FileReader 对象。
  • 之后,我们将调用 AsposePdfToXlsX 函数将 PDF 转换为 Excel XLSX 电子表格。
  • 函数 AsposePdfToXlsX 使用 JSON 对象进行响应。如果我们得到的 json.errorCode 为 0,则 Excel 文件转换成功。否则,我们的文件中有错误,我们可以在 json.errorText 中获取错误消息。
  • 最后,我们将调用 DownloadFile 函数,该函数生成一个链接来下载转换后的 Excel 文件。

以下是使用 JavaScript 将 PDF 转换为 Excel XLSX 的代码。

var ffileToXlsX = function (e) {
  const file_reader = new FileReader();
  file_reader.onload = (event) => {
    
    /*convert a PDF-file to XlsX and save the "ResultPDFtoXlsX.xlsx"*/
    const json = AsposePdfToXlsX(event.target.result, e.target.files[0].name, "ResultPDFtoXlsX.xlsx");
    if (json.errorCode == 0) document.getElementById('output').textContent = json.fileNameResult;
    else document.getElementById('output').textContent = json.errorText;
    
    /*make a link to download the result file*/
    DownloadFile(json.fileNameResult, "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet");
  }
  file_reader.readAsArrayBuffer(e.target.files[0]);
}

获取免费的 JavaScript PDF 库

获取免费的临时许可证 并不受任何限制地使用我们的 JavaScript PDF 库。

免费 PDF 到 Excel 转换器

您还可以探索和使用我们的在线 PDF 到 Excel 转换器,它基于 Aspose.PDF for JavaScript。这是一个免费工具,您无需创建帐户或提供信用卡详细信息。

结论

将 PDF 文件转换为 Excel 电子表格是数据驱动的 Web 应用程序中的常见需求,Aspose.PDF for JavaScript 通过其强大且用户友好的 API 简化了此任务。通过将该库无缝集成到 JavaScript 项目中,开发人员可以高效地从 PDF 文档中提取数据并将其转换为 Excel 电子表格。

Aspose.PDF for JavaScript 不仅简化了转换过程,还提供了高级自定义选项,为开发人员提供了处理不同 PDF 结构并满足特定项目要求所需的工具。在文档中探索有关该库的更多信息。如果您有任何疑问,请通过我们的论坛与我们分享。

也可以看看