Конвертуйте PDF у Excel на Python

Конвертація PDF у Excel може знадобитися в різних випадках, наприклад, для експорту табличних даних у форматі PDF до електронних таблиць, автоматизації завдань у Excel та використання інших функцій Excel для обробки даних. Під час програмної роботи з файлами PDF і Excel вам може знадобитися автоматизувати перетворення PDF у Excel у Python. Щоб досягти цього, ця стаття пропонує вам найпростіше рішення для перетворення файлів PDF у Excel на Python.

Крім того, ви дізнаєтесь, як налаштувати перетворення PDF у Excel за допомогою різних параметрів. Крім того, ви отримаєте безкоштовний онлайн-конвертер PDF у Excel, який можна використовувати будь-де та будь-коли.

Конвертер Python PDF в Excel

Для перетворення PDF у Excel XLS/XLSX ми використаємо Aspose.PDF for Python. Бібліотека призначена для створення, обробки та конвертації PDF-файлів із програм Python.

Використовуйте наступну команду pip, щоб установити бібліотеку з PyPI.

pip install aspose-pdf

Перетворіть PDF на Excel XLS на Python

Aspose.PDF for Python значно спростив конвертацію PDF у Excel XLS. Вам потрібно лише завантажити PDF-файл і зберегти його як XLS у потрібному місці. Щоб конвертувати PDF-файл у XLS у програмі Python, виконайте наведені нижче дії.

  • Створіть екземпляр класу Document та ініціалізуйте його шляхом до вхідного файлу PDF.
  • Створіть об’єкт класу ExcelSaveOptions і встановіть вихідний формат XMLSPREADSHEET2003.
  • Викличте метод Document.save() із назвою вихідного файлу XLS і ExcelSaveOptions як аргументами.

У наведеному нижче прикладі коду показано, як конвертувати PDF у XLS на Python.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xls.xls"

# Відкрийте файл PDF
document = ap.Document(input_pdf)

# Створення та налаштування параметрів збереження
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003

# Збережіть файл у форматі MS Excel
document.save(output_pdf, save_option)

Вхідний файл PDF

Як конвертувати PDF у XLS на Python

Перетворений аркуш Excel

Перетворення PDF у Excel на Python

Збережіть PDF як XLSX у Python

Ви також можете конвертувати PDF у XLSX подібним чином. У цьому випадку вам не потрібно вказувати вихідний формат. Просто збережіть перетворений файл Excel із розширенням .xlsx. Нижче наведено кроки для перетворення PDF у XLSX на Python.

  • Завантажте PDF-файл за допомогою класу Document.
  • Створіть об’єкт класу ExcelSaveOptions.
  • Викличте метод Document.save() і передайте ім’я вихідного файлу та об’єкт DocSaveOptions як аргументи.

У наведеному нижче прикладі коду показано, як конвертувати PDF у XLSX на Python.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf =  DIR_OUTPUT + "convert_pdf_to_xlsx.xlsx"

# Відкрийте документ PDF
document = ap.Document(input_pdf)

# Створення параметрів збереження
save_option = ap.ExcelSaveOptions()

# Збережіть файл у форматі XLSX
document.save(output_pdf, save_option)

Налаштуйте перетворення PDF у Excel

Ви також можете налаштувати перетворення PDF у Excel за допомогою різних параметрів. У наступних розділах показано, як використовувати деякі з доступних параметрів.

PDF в Excel із порожнім першим стовпцем

Цей параметр використовується для додавання порожнього першого стовпця в перетворений аркуш Excel. Щоб установити цей параметр, скористайтеся класом ExcelSaveOptions. У наступному прикладі коду показано, як використовувати цей параметр.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_with_control_column.xls"

# Відкрийте документ PDF
document = ap.Document(input_pdf)

# Створення параметрів збереження
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.insert_blank_column_at_first = True

# Збережіть файл у форматі MS Excel
document.save(output_pdf, save_option)

Мінімізуйте кількість аркушів

За замовчуванням кожна сторінка PDF-файлу перетворюється на аркуш у файлі Excel. Однак ви можете змінити цю поведінку, щоб мінімізувати кількість аркушів у файлі Excel. Для цього вам потрібно встановити для властивості ExcelSaveOptions.minimizethenumberofworksheets значення True. У наведеному нижче прикладі коду показано, як мінімізувати кількість аркушів під час перетворення PDF у Excel.

import aspose.pdf as ap

input_pdf = DIR_INPUT + "multipage.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_single_excel_worksheet.xls"

# Відкрийте документ PDF
document = ap.Document(input_pdf)

# Створення параметрів збереження
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.minimize_the_number_of_worksheets = True

# Збережіть файл у форматі MS Excel
document.save(output_pdf, save_option)

Онлайн конвертер PDF в Excel

Якщо ви хочете конвертувати PDF-файли у формат Excel онлайн, скористайтеся нашим високоякісним і безкоштовним конвертером PDF-файлів у Excel, який розроблено з використанням бібліотеки Aspose.PDF.

Безкоштовний конвертер PDF у XLS

Ви можете отримати безкоштовну ліцензію, щоб конвертувати PDF-файли у формат Excel без обмежень оцінювання.

Ознайомтеся з конвертером PDF в Excel

Ви можете дізнатися більше про нашу PDF-бібліотеку Python, використовуючи документацію. Ви також можете повідомити нам про свої запити через наш форум.

Висновок

У цій статті ви дізналися, як конвертувати PDF-файли в Excel на Python. Ми чітко розглянули перетворення PDF у XLS і XLSX. Крім того, ви бачили, як налаштувати перетворення PDF у Excel за допомогою різних параметрів. Крім того, наприкінці надається безкоштовний онлайн-конвертер PDF у Excel, за допомогою якого можна конвертувати скільки завгодно PDF-файлів.

Дивись також