
Použití JavaScriptu k extrakci textu z PDF je velmi užitečné, když jde o extrakci dat, automatizaci obchodních dokumentů a text mining. Umožňuje vývojářům automatizovat proces shromažďování informací z PDF, což může významně zvýšit produktivitu a efektivitu při práci s velkými objemy dokumentů. V tomto blogovém příspěvku se naučíme, jak extrahovat text z PDF v JavaScriptu. Ať už chcete zjednodušit svůj pracovní postup, zlepšit analýzu dat nebo jednoduše automatizovat opakující se úkoly, tento průvodce vás vybaví znalostmi pro efektivní extrakci textu z PDF pomocí JavaScriptu.
Tento článek pokrývá následující témata:
- PDF JavaScript knihovna pro extrakci textu
- Extrahovat text z PDF v JavaScriptu
- Vyzkoušejte online převodník PDF na text
- Zdarma zdroje
PDF JavaScript knihovna pro extrakci textu
Budeme používat Aspose.PDF pro JavaScript k extrakci textu z pdf souboru pomocí JavaScriptu. Je to výkonná PDF knihovna, která nabízí robustní funkce pro práci s PDF soubory v JavaScriptu. Podporuje širokou škálu úkolů manipulace s PDF, včetně extrakce textu, tvorby a úprav dokumentů. Aspose.PDF pro JavaScript je snadno použitelná a poskytuje vývojářům jednoduché API pro efektivní zvládání složitých operací s PDF.
Prosím stáhněte si knihovnu a postupujte podle instalačních pokynů zde: Instalace Aspose.PDF pro JavaScript.
Extrahovat text z PDF v JavaScriptu
Můžeme snadno extrahovat text z PDF v JavaScriptu v rámci webové aplikace. K tomuto účelu potřebujeme načíst PDF soubor a poté extrahovat text. Náročný úkol extrakce textu bude předán webovému pracovnímu vláknu, což zabrání blokování hlavního UI vlákna. Tak se naše konvertorová aplikace stane uživatelsky přívětivou a stahování skrze konverzi je zjednodušeno.
Postupujte podle následujících kroků pro extrakci textu z PDF v JavaScriptu:
- Vytvořte webového pracovníka pomocí následujícího kódu:
/*Create Web Worker*/ | |
const AsposePDFWebWorker = new Worker("AsposePDFforJS.js"); | |
AsposePDFWebWorker.onerror = evt => console.log(`Error from Web Worker: ${evt.message}`); | |
AsposePDFWebWorker.onmessage = evt => document.getElementById('output').textContent = | |
(evt.data == 'ready') ? 'loaded!' : | |
(evt.data.json.errorCode == 0) ? | |
evt.data.json.extractText : | |
`Error: ${evt.data.json.errorText}`; | |
/*Event handler*/ | |
const ffileExtract = e => { | |
const file_reader = new FileReader(); | |
file_reader.onload = event => { | |
/*Extract text from a PDF-file - Ask Web Worker*/ | |
AsposePDFWebWorker.postMessage( | |
{ "operation": 'AsposePdfExtractText', "params": [event.target.result, e.target.files[0].name] }, | |
[event.target.result] | |
); | |
}; | |
file_reader.readAsArrayBuffer(e.target.files[0]); | |
}; |
- Extrahujte text z PDF souboru následujícími kroky:
- Vyberte vstupní PDF soubor.
- Vytvořte nový objekt FileReader.
- Nyní zavolejte funkci AsposePdfExtractText, která extrahuje text z PDF souboru.
- Poté, pokud je json.errorCode 0, pak json.extractText bude obsahovat extrahovaný obsah. Jinak dojde k chybě a chybová zpráva bude zapsána do souboru json.errorText.
- Nakonec obdržíte řetězec s extrahovaným textem z vašeho PDF.
Následující ukázka kódu ukazuje jak extrahovat text z PDF souboru pomocí JavaScriptu.
var ffileExtract = function (e) { | |
const file_reader = new FileReader(); | |
file_reader.onload = (event) => { | |
/*Extract text from a PDF-file*/ | |
const json = AsposePdfExtractText(event.target.result, e.target.files[0].name); | |
if (json.errorCode == 0) document.getElementById('output').textContent = json.extractText; | |
else document.getElementById('output').textContent = json.errorText; | |
}; | |
file_reader.readAsArrayBuffer(e.target.files[0]); | |
}; |
Podívejte se na náš kompletní článek o konverzi TXT na PDF pomocí JavaScriptu.
Získejte zdarma JavaScript PDF knihovnu
Získejte bezplatnou dočasnou licenci a odemkněte plný potenciál této JavaScript PDF knihovny bez omezení. Ponořte se a prozkoumejte všechny její funkce do sytosti!
Vyzkoušejte online převodník PDF na text
Můžete také extrahovat text z PDF souboru online pomocí tohoto bezplatného nástroje PDF to Text Converter. Tento výkonný nástroj nabízí bezproblémovou konverzi PDF na TXT, což z něj činí nepostradatelný zdroj pro každého, kdo potřebuje extrahovat text z PDF dokumentů.

Tento uživatelsky přívětivý, vysoce kvalitní konvertor umožňuje rychlou a efektivní extrakci textu z PDF. Bez nutnosti instalace a s důrazem na bezpečnost je to perfektní řešení pro jednotlivce i firmy.
PDF JS extrahovat text – zdroje k učení
Kromě extrakce textu z PDF v JavaScriptu se ponořte hlouběji do tvorby, manipulace a konverze PDF souborů. Prozkoumejte komplexní funkce knihovny prostřednictvím následujících zdrojů:
Závěr
V tomto blogovém příspěvku jsme se naučili, jak extrahovat text z PDF v JavaScriptu. Extrakce textu z PDF pomocí JavaScriptu je silná technika, která může výrazně zlepšit vaše webové aplikace a automatizované pracovní postupy. Využitím Aspose.PDF pro JavaScript můžete efektivně číst a extrahovat text z PDF dokumentu. Pokud máte jakékoli otázky, neváhejte nás kontaktovat přes náš bezplatný podpůrný fórum.