Konvertera PDF till Word i JavaScript

När du bearbetar dokument i en webbapplikation är möjligheten att sömlöst konvertera PDF-filer till Word-dokument en värdefull tillgång. Denna uppgift är inte bara vanlig utan också väsentlig för olika applikationer, såsom dokumentkonverterare och redigerare, från redigering och samarbete till innehållsextraktion. I det här blogginlägget kommer vi att utforska hur man konverterar en PDF-fil till ett Word DOC/DOCX-dokument i JavaScript.

JavaScript-bibliotek för att konvertera PDF till Word

För konvertering av PDF till Word-dokument i JavaScript kommer vi att använda Aspose.PDF för JavaScript. Det är ett omfattande bibliotek som ger utvecklare möjlighet att arbeta med PDF-generering, manipulation, redigering och konvertering programmatiskt. Biblioteket är designat för att vara lätt att använda och integreras sömlöst i JavaScript-applikationer, vilket gör det till ett idealiskt val för PDF-relaterade uppgifter.

Ladda ner biblioteket och följ installationsinstruktionerna här: Installera Aspose.PDF för JavaScript.

Konvertera en PDF till Word DOC i JavaScript

Med Aspose.PDF behöver du inte gå igenom den komplexa PDF till Word-konverteringsprocessen. Ladda bara in PDF-filen och spara den i Word-format. Vi kommer dock att ladda ner resurskrävande PDF till DOC-konverteringsuppgift till en webbarbetare för att förhindra blockering av huvudgränssnittstråden. Detta säkerställer ett användarvänligt sätt att ladda ner det konverterade Word-dokumentet i en webbapplikation.

Följande är stegen du behöver utföra för PDF till DOC-konvertering i JavaScript.

  1. Skapa en webbarbetare, som visas i följande kodavsnitt.
/*Create Web Worker*/
const AsposePDFWebWorker = new Worker("AsposePDFforJS.js");
AsposePDFWebWorker.onerror = evt => console.log(`Error from Web Worker: ${evt.message}`);
AsposePDFWebWorker.onmessage = evt => document.getElementById('output').textContent = 
  (evt.data == 'ready') ? 'loaded!' :
    (evt.data.json.errorCode == 0) ? `Result:\n${DownloadFile(evt.data.json.fileNameResult, "application/msword", evt.data.params[0])}` : `Error: ${evt.data.json.errorText}`;

/*Event handler*/
const ffileToDoc = e => {
  const file_reader = new FileReader();
  file_reader.onload = event => {
    /*Convert a PDF-file to Doc and save the "ResultPDFtoDoc.doc" - Ask Web Worker*/
    AsposePDFWebWorker.postMessage({ "operation": 'AsposePdfToDoc', "params": [event.target.result, e.target.files[0].name, "ResultPDFtoDoc.doc"] }, [event.target.result]);
  };
  file_reader.readAsArrayBuffer(e.target.files[0]);
};

/*Make a link to download the result file*/
const DownloadFile = (filename, mime, content) => {
    mime = mime || "application/octet-stream";
    var link = document.createElement("a"); 
    link.href = URL.createObjectURL(new Blob([content], {type: mime}));
    link.download = filename;
    link.innerHTML = "Click here to download the file " + filename;
    document.body.appendChild(link); 
    document.body.appendChild(document.createElement("br"));
    return filename;
  }
  1. Skriv koden för att konvertera PDF till DOC genom att följa stegen nedan.
  • Välj först en PDF-fil som du vill konvertera.
  • Skapa sedan ett nytt FileReader-objekt.
  • Ring AsposePdfToDoc-funktionen som konverterar PDF till Word-format. Den här funktionen accepterar även namnet på den konverterade Word-filen.
  • Därefter, om json.errorCode är 0, får din resulterande Word-fil det namn du angav tidigare. Annars kommer det att uppstå ett fel i din fil och felmeddelandet loggas i filen json.errorText.
  • Slutligen genererar DownloadFile-funktionen en länk för att ladda ner den konverterade Word-filen.

Nedan finns kodavsnittet för att konvertera en PDF till Word DOC-format i JavaScript.

var ffileToDoc = function (e) {
  const file_reader = new FileReader();
  file_reader.onload = (event) => {
    /*Convert a PDF-file to Doc and save the "ResultPDFtoDoc.doc"*/
    const json = AsposePdfToDoc(event.target.result, e.target.files[0].name, "ResultPDFtoDoc.doc");
    if (json.errorCode == 0) document.getElementById('output').textContent = json.fileNameResult;
    else document.getElementById('output').textContent = json.errorText;
    /*Make a link to download the result file*/
    DownloadFile(json.fileNameResult, "application/msword");
  }
  file_reader.readAsArrayBuffer(e.target.files[0]);
}

Konvertera PDF till DOCX i JavaScript

Om du behöver konvertera din PDF till DOCX-format kan du göra det enligt samma process med små ändringar för att få Word-dokumentet som DOCX. Så låt oss konvertera en PDF till ett DOCX-dokument i JavaScript.

  1. Skapa webbarbetaren med kodavsnittet nedan.
/*Create Web Worker*/
const AsposePDFWebWorker = new Worker("AsposePDFforJS.js");
AsposePDFWebWorker.onerror = evt => console.log(`Error from Web Worker: ${evt.message}`);
AsposePDFWebWorker.onmessage = evt => document.getElementById('output').textContent = 
  (evt.data == 'ready') ? 'loaded!' :
    (evt.data.json.errorCode == 0) ? `Result:\n${DownloadFile(evt.data.json.fileNameResult, "application/vnd.openxmlformats-officedocument.wordprocessingml.document", evt.data.params[0])}` : `Error: ${evt.data.json.errorText}`;

/*Event handler*/
const ffileToDocX = e => {
  const file_reader = new FileReader();
  file_reader.onload = event => {
    /*convert a PDF-file to DocX and save the "ResultPDFtoDocX.docx" - Ask Web Worker*/
    AsposePDFWebWorker.postMessage({ "operation": 'AsposePdfToDocX', "params": [event.target.result, e.target.files[0].name, "ResultPDFtoDocX.docx"] }, [event.target.result]);
  };
  file_reader.readAsArrayBuffer(e.target.files[0]);
};
/// [Kodavsnitt]

/*make a link to download the result file*/
const DownloadFile = (filename, mime, content) => {
    mime = mime || "application/octet-stream";
    var link = document.createElement("a"); 
    link.href = URL.createObjectURL(new Blob([content], {type: mime}));
    link.download = filename;
    link.innerHTML = "Click here to download the file " + filename;
    document.body.appendChild(link); 
    document.body.appendChild(document.createElement("br"));
    return filename;
  }
  1. Skriv nu koden för att konvertera PDF till DOCX. Här kommer du att använda metoden AsposePdfToDocX istället för AsposePdfToDoc.
var ffileToDocX = function (e) {
  const file_reader = new FileReader();
  file_reader.onload = (event) => {
    /*convert a PDF-file to DocX and save the "ResultPDFtoDocX.docx"*/
    const json = AsposePdfToDocX(event.target.result, e.target.files[0].name, "ResultPDFtoDocX.docx");
    if (json.errorCode == 0) document.getElementById('output').textContent = json.fileNameResult;
    else document.getElementById('output').textContent = json.errorText;
    /*make a link to download the result file*/
    DownloadFile(json.fileNameResult, "application/vnd.openxmlformats-officedocument.wordprocessingml.document");
  }
  file_reader.readAsArrayBuffer(e.target.files[0]);
}

Skaffa gratis JavaScript PDF-bibliotek

Du kan skaffa en gratis tillfällig licens och använda detta JavaScript PDF-bibliotek utan några begränsningar.

Slutsats

I det här blogginlägget utforskade vi processen att konvertera PDF-filer till Word-dokument med JavaScript. Stegen och kodavsnitten som tillhandahålls i det här blogginlägget effektiviserar konverteringarna från PDF till DOC och PDF till DOCX i JavaScript-applikationer. Med sin enkla integration och kraftfulla möjligheter förenklar Aspose.PDF dokumentmanipuleringsuppgifter, vilket gör det möjligt för utvecklare att förbättra sina applikationer med effektiv PDF-till-Word-konvertering.

När du fortsätter att utforska funktionerna i Aspose.PDF för JavaScript, kommer du att upptäcka en mängd funktioner för att förbättra dina dokumenthanteringslösningar. Berätta för oss om din erfarenhet av Aspose.PDF eller dela dina frågor via vårt forum.