Конвертируйте PDF в Excel с помощью JavaScript

В мире управления данными преобразование информации из одного формата в другой является обычной необходимостью. Одним из таких часто возникающих преобразований является преобразование данных из документа PDF в электронную таблицу Excel. Разработчики JavaScript, ищущие надежное и эффективное решение этой задачи, могут обратиться к Aspose.PDF for JavaScript, мощной библиотеке, которая упрощает манипулирование PDF-файлами. В этой записи блога мы рассмотрим процесс преобразования PDF в Excel в приложениях JavaScript.

Библиотека JavaScript для преобразования PDF в Excel

Чтобы преобразовать PDF-файлы в листы Excel, мы будем использовать Aspose.PDF for JavaScript. Это многофункциональная библиотека, которая позволяет разработчикам программно работать с документами PDF. Он позволяет легко создавать, обрабатывать и конвертировать PDF-файлы.

Загрузите библиотеку и следуйте инструкциям по установке, представленным здесь: Как установить Aspose.PDF for JavaScript.

Преобразование PDF в Excel XLSX с помощью JavaScript

Это простой процесс преобразования PDF в формат Excel с использованием Aspose.PDF for JavaScript. Просто загрузите файл и вызовите функцию преобразования. Однако, чтобы предотвратить блокировку основного потока пользовательского интерфейса, мы напишем веб-работника, который сделает процесс преобразования PDF-файлов и загрузки файлов Excel более плавным.

Итак, давайте шаг за шагом преобразуем PDF в Excel XLSX с помощью JavaScript.

  1. Используйте следующий фрагмент кода, чтобы создать веб-работника.
/*Create Web Worker*/
const AsposePDFWebWorker = new Worker("AsposePDFforJS.js");
AsposePDFWebWorker.onerror = evt => console.log(`Error from Web Worker: ${evt.message}`);
AsposePDFWebWorker.onmessage = evt => document.getElementById('output').textContent = 
  (evt.data == 'ready') ? 'loaded!' :
    (evt.data.json.errorCode == 0) ? `Result:\n${DownloadFile(evt.data.json.fileNameResult, "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet", evt.data.params[0])}` : `Error: ${evt.data.json.errorText}`;

/*Event handler*/
const ffileToXlsX = e => {
  const file_reader = new FileReader();
  file_reader.onload = event => {
    /*convert a PDF-file to XlsX and save the "ResultPDFtoXlsX.xlsx" - Ask Web Worker*/
    AsposePDFWebWorker.postMessage({ "operation": 'AsposePdfToXlsX', "params": [event.target.result, e.target.files[0].name, "ResultPDFtoXlsX.xlsx"] }, [event.target.result]);
  };
  file_reader.readAsArrayBuffer(e.target.files[0]);
};
/// [фрагмент кода]

/*make a link to download the result file*/
const DownloadFile = (filename, mime, content) => {
    mime = mime || "application/octet-stream";
    var link = document.createElement("a"); 
    link.href = URL.createObjectURL(new Blob([content], {type: mime}));
    link.download = filename;
    link.innerHTML = "Click here to download the file " + filename;
    document.body.appendChild(link); 
    document.body.appendChild(document.createElement("br"));
    return filename;
  }
  1. Выполните следующие шаги, чтобы преобразовать PDF в файл Excel.
  • Сначала нам нужно выбрать PDF-файл, который нужно преобразовать в формат Excel XLSX.
  • Затем мы создадим новый объект FileReader.
  • После этого мы вызовем функцию AsposePdfToXlsX, которая преобразует PDF в электронную таблицу Excel XLSX.
  • Функция AsposePdfToXlsX отвечает объектом JSON. Если мы получим json.errorCode как 0, файл Excel будет успешно преобразован. В противном случае в нашем файле есть ошибка, и мы можем получить сообщение об ошибке в json.errorText.
  • В конце мы вызовем функцию DownloadFile, которая сгенерирует ссылку для загрузки преобразованного файла Excel.

Ниже приведен код для преобразования PDF в Excel XLSX в JavaScript.

var ffileToXlsX = function (e) {
  const file_reader = new FileReader();
  file_reader.onload = (event) => {
    
    /*convert a PDF-file to XlsX and save the "ResultPDFtoXlsX.xlsx"*/
    const json = AsposePdfToXlsX(event.target.result, e.target.files[0].name, "ResultPDFtoXlsX.xlsx");
    if (json.errorCode == 0) document.getElementById('output').textContent = json.fileNameResult;
    else document.getElementById('output').textContent = json.errorText;
    
    /*make a link to download the result file*/
    DownloadFile(json.fileNameResult, "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet");
  }
  file_reader.readAsArrayBuffer(e.target.files[0]);
}

Получите бесплатную PDF-библиотеку JavaScript

Получите бесплатную временную лицензию и используйте нашу библиотеку JavaScript PDF без каких-либо ограничений.

Бесплатный конвертер PDF в Excel

Вы также можете изучить и использовать наш онлайн-конвертер PDF в Excel, основанный на Aspose.PDF for JavaScript. Это бесплатный инструмент, и вам не нужно создавать учетную запись или предоставлять данные кредитной карты.

Заключение

Преобразование PDF-файлов в электронные таблицы Excel является обычной необходимостью в веб-приложениях, управляемых данными, и Aspose.PDF for JavaScript упрощает эту задачу благодаря мощному и удобному API. Путем плавной интеграции библиотеки в проекты JavaScript разработчики могут эффективно извлекать данные из документов PDF и преобразовывать их в электронные таблицы Excel.

Aspose.PDF for JavaScript не только оптимизирует процесс преобразования, но также предлагает расширенные возможности настройки, предоставляя разработчикам инструменты, необходимые для обработки разнообразных структур PDF и удовлетворения конкретных требований проекта. Узнайте больше о библиотеке в документации. Если у вас есть какие-либо вопросы, поделитесь ими с нами через наш форум.

Смотрите также