Převeďte PDF do Excelu v Python

Převod PDF do Excel může být vyžadován v různých případech, například pro export tabulkových dat v PDF do tabulek, automatizaci úloh v Excelu a použití dalších funkcí Excelu pro manipulaci s daty. Při programové práci se soubory PDF a Excel možná budete muset v Python automatizovat převod PDF do Excelu. Chcete-li toho dosáhnout, tento článek vám poskytuje nejjednodušší řešení pro převod souborů PDF do Excelu v Python.

Kromě toho se naučíte, jak přizpůsobit převod PDF do Excelu pomocí různých možností. Získáte také bezplatný online převodník PDF do Excelu, který můžete použít kdekoli a kdykoli.

Python převodník PDF do Excelu

Pro převod PDF do Excelu XLS/XLSX použijeme Aspose.PDF for Python. Knihovna je navržena tak, aby vytvářela, zpracovávala a převáděla soubory PDF z aplikací Python.

K instalaci knihovny z [PyPI] použijte následující příkaz pip (https://pypi.org/project/aspose-pdf/).

pip install aspose-pdf

Převeďte PDF do Excelu XLS v Python

Aspose.PDF for Python docela usnadnil převod PDF do Excelu XLS. Stačí načíst soubor PDF a uložit jej jako XLS na požadované místo. Chcete-li převést soubor PDF na XLS v aplikaci Python, postupujte podle níže uvedených kroků.

  • Vytvořte instanci třídy Document a inicializujte ji s cestou vstupního souboru PDF.
  • Vytvořte objekt třídy ExcelSaveOptions a nastavte výstupní formát na XMLSPREADSHEET2003.
  • Zavolejte metodu Document.save() s názvem výstupního souboru XLS a ExcelSaveOptions jako argumenty.

Následující ukázka kódu ukazuje, jak převést PDF na XLS v Python.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xls.xls"

# Otevřete soubor PDF
document = ap.Document(input_pdf)

# Vytvořte a nastavte možnosti uložení
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003

# Uložte soubor do formátu MS Excel
document.save(output_pdf, save_option)

Vstupní soubor PDF

Jak převést PDF na XLS v Python

Převedený list Excelu

Převod PDF do Excelu v Python

Uložit PDF jako XLSX v Python

Podobným způsobem můžete také převést PDF do XLSX. V tomto případě nemusíte zadávat žádný výstupní formát. Jednoduše uložte převedený soubor Excel s příponou .xlsx. Níže jsou uvedeny kroky pro převod PDF na XLSX v Python.

  • Načtěte soubor PDF pomocí třídy Document.
  • Vytvořte objekt třídy ExcelSaveOptions.
  • Zavolejte metodu Document.save() a předejte název výstupního souboru a objekt DocSaveOptions jako argumenty.

Následující ukázka kódu ukazuje, jak převést PDF na XLSX v Python.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf =  DIR_OUTPUT + "convert_pdf_to_xlsx.xlsx"

# Otevřete dokument PDF
document = ap.Document(input_pdf)

# Vytvořte možnosti uložení
save_option = ap.ExcelSaveOptions()

# Uložte soubor do XLSX
document.save(output_pdf, save_option)

Přizpůsobte převod PDF do Excelu

Převod PDF do Excelu můžete také přizpůsobit pomocí různých možností. Následující části ukazují, jak používat několik dostupných možností.

PDF do Excelu s prázdným prvním sloupcem

Tato možnost se používá k přidání prázdného prvního sloupce do převedeného listu aplikace Excel. K nastavení této možnosti použijete třídu ExcelSaveOptions. Následující ukázka kódu ukazuje, jak tuto možnost použít.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_with_control_column.xls"

# Otevřete dokument PDF
document = ap.Document(input_pdf)

# Vytvořte možnosti uložení
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.insert_blank_column_at_first = True

# Uložte soubor do formátu MS Excel
document.save(output_pdf, save_option)

Minimalizujte počet pracovních listů

Ve výchozím nastavení je každá stránka v PDF převedena na list v souboru Excel. Toto chování však můžete přepsat, abyste minimalizovali počet listů v souboru aplikace Excel. K tomu je třeba nastavit vlastnost ExcelSaveOptions.minimizethenumberofworksheets na hodnotu True. Následující ukázka kódu ukazuje, jak minimalizovat počet listů v převodu PDF do Excelu.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "multipage.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_single_excel_worksheet.xls"

# Otevřete dokument PDF
document = ap.Document(input_pdf)

# Vytvořte možnosti uložení
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.minimize_the_number_of_worksheets = True

# Uložte soubor do formátu MS Excel
document.save(output_pdf, save_option)

Online převodník PDF do Excelu

Pokud chcete převést soubory PDF do formátu Excel online, použijte náš vysoce kvalitní a bezplatný převodník PDF do Excelu, který je vyvinut pomocí knihovny Aspose.PDF.

Zdarma převodník PDF do XLS

Můžete získat bezplatnou licenci pro převod souborů PDF do formátu Excel bez omezení hodnocení.

Prozkoumejte převodník PDF do Excelu

Můžete se dozvědět více o naší Python PDF knihovně pomocí dokumentace. Můžete nám také sdělit své dotazy prostřednictvím našeho fóra.

Závěr

V tomto článku jste se naučili, jak převést soubory PDF do Excelu v Python. Výslovně jsme se zabývali převodem PDF do XLS a XLSX. Kromě toho jste viděli, jak přizpůsobit převod PDF do Excelu pomocí různých možností. Na konci je také k dispozici bezplatný online převodník PDF do Excelu, který můžete použít k převodu libovolného množství souborů PDF.

Viz také