Konwertuj pliki PDF na Excel w Python

Konwersja PDF do Excel może być wymagana w różnych przypadkach, na przykład do eksportowania danych tabelarycznych w formacie PDF do arkuszy kalkulacyjnych, automatyzacji zadań w programie Excel i korzystania z innych funkcji programu Excel do manipulowania danymi. Podczas programowej pracy z plikami PDF i Excel może być konieczne zautomatyzowanie konwersji plików PDF do Excel w Python. Aby to osiągnąć, w tym artykule znajdziesz najłatwiejsze rozwiązanie do konwersji plików PDF do formatu Excel w Python.

Ponadto dowiesz się, jak dostosować konwersję PDF do Excela za pomocą różnych opcji. Otrzymasz również darmowy internetowy konwerter plików PDF na Excel, z którego możesz korzystać w dowolnym miejscu i czasie.

Konwerter PDF do Excela w Python

Do konwersji PDF do Excel XLS/XLSX użyjemy Aspose.PDF for Python. Biblioteka jest przeznaczona do tworzenia, przetwarzania i konwertowania plików PDF z poziomu aplikacji Python.

Użyj następującego polecenia pip, aby zainstalować bibliotekę z PyPI.

pip install aspose-pdf

Konwertuj plik PDF na Excel XLS w Python

Aspose.PDF for Python znacznie ułatwił konwersję pliku PDF do formatu Excel XLS. Wystarczy załadować plik PDF i zapisać go jako XLS w wybranej lokalizacji. Możesz wykonać poniższe kroki, aby przekonwertować plik PDF na XLS w swojej aplikacji Python.

  • Utwórz instancję klasy Document i zainicjuj ją ścieżką wejściowego pliku PDF.
  • Utwórz obiekt klasy ExcelSaveOptions i ustaw format wyjściowy na XMLSPREADSHEET2003.
  • Wywołaj metodę Document.save() z nazwą wyjściowego pliku XLS i ExcelSaveOptions jako argumentami.

Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na format XLS w języku Python.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xls.xls"

# Otwórz plik PDF
document = ap.Document(input_pdf)

# Utwórz i ustaw opcje zapisywania
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003

# Zapisz plik w formacie MS Excel
document.save(output_pdf, save_option)

Wprowadź plik PDF

Jak przekonwertować PDF na XLS w Python

Przekonwertowany arkusz Excela

Konwersja PDF do Excela w Python

Zapisz PDF jako XLSX w Python

Możesz także przekonwertować PDF na XLSX w podobny sposób. W takim przypadku nie trzeba określać żadnego formatu wyjściowego. Po prostu zapisz przekonwertowany plik Excela z rozszerzeniem .xlsx. Poniżej przedstawiono kroki konwersji plików PDF na XLSX w Python.

  • Załaduj plik PDF za pomocą klasy Document.
  • Utwórz obiekt klasy ExcelSaveOptions.
  • Wywołaj metodę Document.save() i przekaż nazwę pliku wyjściowego oraz obiekt DocSaveOptions jako argumenty.

Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na format XLSX w języku Python.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf =  DIR_OUTPUT + "convert_pdf_to_xlsx.xlsx"

# Otwórz dokument PDF
document = ap.Document(input_pdf)

# Utwórz opcje zapisywania
save_option = ap.ExcelSaveOptions()

# Zapisz plik w formacie XLSX
document.save(output_pdf, save_option)

Dostosuj konwersję PDF do Excela

Możesz także dostosować konwersję PDF do Excela, korzystając z różnych opcji. W poniższych sekcjach pokazano, jak korzystać z kilku dostępnych opcji.

PDF do programu Excel z pustą pierwszą kolumną

Ta opcja służy do dodawania pustej pierwszej kolumny w przekonwertowanym arkuszu Excel. Aby ustawić tę opcję, użyjesz klasy ExcelSaveOptions. Poniższy przykład kodu pokazuje, jak używać tej opcji.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_with_control_column.xls"

# Otwórz dokument PDF
document = ap.Document(input_pdf)

# Utwórz opcje zapisywania
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.insert_blank_column_at_first = True

# Zapisz plik w formacie MS Excel
document.save(output_pdf, save_option)

Zminimalizuj liczbę arkuszy roboczych

Domyślnie każda strona w formacie PDF jest konwertowana na arkusz w pliku Excel. Można jednak zmienić to zachowanie, aby zminimalizować liczbę arkuszy w pliku programu Excel. W tym celu należy ustawić właściwość ExcelSaveOptions.minimizethenumberofworksheets na True. Poniższy przykładowy kod pokazuje, jak zminimalizować liczbę arkuszy podczas konwersji plików PDF na Excel.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "multipage.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_single_excel_worksheet.xls"

# Otwórz dokument PDF
document = ap.Document(input_pdf)

# Utwórz opcje zapisywania
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.minimize_the_number_of_worksheets = True

# Zapisz plik w formacie MS Excel
document.save(output_pdf, save_option)

Internetowy konwerter plików PDF na Excel

Jeśli chcesz konwertować pliki PDF do formatu Excel online, skorzystaj z naszego wysokiej jakości i bezpłatnego konwertera plików PDF na Excel, który został opracowany przy użyciu biblioteki Aspose.PDF.

Darmowy konwerter plików PDF na XLS

Możesz uzyskać bezpłatną licencję na konwersję plików PDF do formatu Excel bez ograniczeń ewaluacyjnych.

Przeglądaj PDF to Excel Converter

Możesz dowiedzieć się więcej o naszej bibliotece PDF w języku Python, korzystając z dokumentacji. Możesz też swobodnie informować nas o swoich zapytaniach za pośrednictwem naszego forum.

Wniosek

W tym artykule nauczyłeś się konwertować pliki PDF do formatu Excel w Python. Wyraźnie omówiliśmy konwersję PDF do XLS i XLSX. Ponadto widziałeś, jak dostosować konwersję PDF do Excela za pomocą różnych opcji. Ponadto na końcu dostępny jest darmowy internetowy konwerter plików PDF na Excel, którego można użyć do konwersji dowolnej liczby plików PDF.

Zobacz też