Chuyển đổi PDF sang Excel bằng JavaScript

Trong thế giới quản lý dữ liệu, việc chuyển đổi thông tin từ định dạng này sang định dạng khác là điều cần thiết phổ biến. Một chuyển đổi như vậy thường phát sinh là chuyển đổi dữ liệu từ tài liệu PDF sang bảng tính Excel. Các nhà phát triển JavaScript đang tìm kiếm giải pháp đáng tin cậy và hiệu quả cho tác vụ này có thể chuyển sang Aspose.PDF for JavaScript, một thư viện mạnh mẽ hỗ trợ thao tác PDF liền mạch. Trong bài đăng trên blog này, chúng ta sẽ khám phá quá trình chuyển đổi PDF sang Excel trong các ứng dụng JavaScript.

Thư viện JavaScript để chuyển đổi PDF sang Excel

Để chuyển đổi tệp PDF thành trang tính Excel, chúng tôi sẽ sử dụng Aspose.PDF for JavaScript. Đây là một thư viện giàu tính năng cho phép các nhà phát triển làm việc với các tài liệu PDF theo chương trình. Nó cho phép bạn tạo, xử lý và chuyển đổi các tệp PDF một cách dễ dàng.

Tải xuống thư viện và làm theo hướng dẫn cài đặt được cung cấp tại đây: Cách cài đặt Aspose.PDF for JavaScript.

Chuyển đổi PDF sang Excel XLSX bằng JavaScript

Đây là một quá trình đơn giản để chuyển đổi định dạng PDF sang Excel bằng Aspose.PDF for JavaScript. Chỉ cần tải tệp và gọi hàm chuyển đổi. Tuy nhiên, để tránh chặn luồng giao diện người dùng chính, chúng tôi sẽ viết một nhân viên web để giúp quá trình chuyển đổi tệp PDF và tải xuống tệp Excel mượt mà hơn.

Vì vậy, hãy từng bước chuyển đổi PDF sang Excel XLSX bằng JavaScript.

  1. Sử dụng đoạn mã sau để tạo một nhân viên web.
/*Create Web Worker*/
const AsposePDFWebWorker = new Worker("AsposePDFforJS.js");
AsposePDFWebWorker.onerror = evt => console.log(`Error from Web Worker: ${evt.message}`);
AsposePDFWebWorker.onmessage = evt => document.getElementById('output').textContent = 
  (evt.data == 'ready') ? 'loaded!' :
    (evt.data.json.errorCode == 0) ? `Result:\n${DownloadFile(evt.data.json.fileNameResult, "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet", evt.data.params[0])}` : `Error: ${evt.data.json.errorText}`;

/*Event handler*/
const ffileToXlsX = e => {
  const file_reader = new FileReader();
  file_reader.onload = event => {
    /*convert a PDF-file to XlsX and save the "ResultPDFtoXlsX.xlsx" - Ask Web Worker*/
    AsposePDFWebWorker.postMessage({ "operation": 'AsposePdfToXlsX', "params": [event.target.result, e.target.files[0].name, "ResultPDFtoXlsX.xlsx"] }, [event.target.result]);
  };
  file_reader.readAsArrayBuffer(e.target.files[0]);
};
/// [Đoạn mã]

/*make a link to download the result file*/
const DownloadFile = (filename, mime, content) => {
    mime = mime || "application/octet-stream";
    var link = document.createElement("a"); 
    link.href = URL.createObjectURL(new Blob([content], {type: mime}));
    link.download = filename;
    link.innerHTML = "Click here to download the file " + filename;
    document.body.appendChild(link); 
    document.body.appendChild(document.createElement("br"));
    return filename;
  }
  1. Thực hiện theo các bước dưới đây để chuyển đổi tệp PDF sang Excel.
  • Đầu tiên chúng ta cần chọn file PDF cần chuyển sang định dạng Excel XLSX.
  • Sau đó, chúng ta sẽ tạo một đối tượng FileReader mới.
  • Sau đó, chúng ta sẽ gọi hàm AsposePdfToXlsX để chuyển đổi bảng tính PDF sang Excel XLSX.
  • Hàm AsposePdfToXlsX phản hồi bằng một đối tượng JSON. Nếu chúng tôi nhận được json.errorCode là 0 thì tệp Excel đã được chuyển đổi thành công. Ngược lại, có lỗi trong tệp của chúng tôi và chúng tôi có thể nhận được thông báo lỗi trong json.errorText.
  • Cuối cùng, chúng ta sẽ gọi hàm DownloadFile để tạo liên kết tải xuống tệp Excel đã chuyển đổi.

Sau đây là mã để chuyển đổi PDF sang Excel XLSX bằng JavaScript.

var ffileToXlsX = function (e) {
  const file_reader = new FileReader();
  file_reader.onload = (event) => {
    
    /*convert a PDF-file to XlsX and save the "ResultPDFtoXlsX.xlsx"*/
    const json = AsposePdfToXlsX(event.target.result, e.target.files[0].name, "ResultPDFtoXlsX.xlsx");
    if (json.errorCode == 0) document.getElementById('output').textContent = json.fileNameResult;
    else document.getElementById('output').textContent = json.errorText;
    
    /*make a link to download the result file*/
    DownloadFile(json.fileNameResult, "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet");
  }
  file_reader.readAsArrayBuffer(e.target.files[0]);
}

Nhận thư viện PDF JavaScript miễn phí

Nhận giấy phép tạm thời miễn phí và sử dụng thư viện JavaScript PDF của chúng tôi mà không có bất kỳ giới hạn nào.

Chuyển đổi PDF sang Excel miễn phí

Bạn cũng có thể khám phá và sử dụng trình chuyển đổi PDF sang Excel trực tuyến của chúng tôi, dựa trên Aspose.PDF for JavaScript. Đây là một công cụ miễn phí và bạn không cần phải tạo tài khoản hoặc cung cấp thông tin thẻ tín dụng.

Phần kết luận

Chuyển đổi tệp PDF sang bảng tính Excel là điều cần thiết phổ biến trong các ứng dụng web dựa trên dữ liệu và Aspose.PDF dành cho JavaScript đơn giản hóa tác vụ này bằng API mạnh mẽ và thân thiện với người dùng. Bằng cách tích hợp liền mạch thư viện vào các dự án JavaScript, nhà phát triển có thể trích xuất dữ liệu từ tài liệu PDF một cách hiệu quả và chuyển đổi nó thành bảng tính Excel.

Aspose.PDF for JavaScript không chỉ đơn giản hóa quy trình chuyển đổi mà còn cung cấp các tùy chọn tùy chỉnh nâng cao, cung cấp cho nhà phát triển những công cụ họ cần để xử lý các cấu trúc PDF đa dạng và đáp ứng các yêu cầu cụ thể của dự án. Khám phá thêm về thư viện trong tài liệu. Trong trường hợp bạn có bất kỳ thắc mắc nào, vui lòng chia sẻ chúng với chúng tôi qua diễn đàn của chúng tôi.

Xem thêm