Конвертація PDF у Excel може знадобитися в різних випадках, наприклад, для експорту табличних даних у форматі PDF до електронних таблиць, автоматизації завдань у Excel та використання інших функцій Excel для обробки даних. Під час програмної роботи з файлами PDF і Excel вам може знадобитися автоматизувати перетворення PDF у Excel у Python. Щоб досягти цього, ця стаття пропонує вам найпростіше рішення для перетворення файлів PDF у Excel на Python.
Крім того, ви дізнаєтесь, як налаштувати перетворення PDF у Excel за допомогою різних параметрів. Крім того, ви отримаєте безкоштовний онлайн-конвертер PDF у Excel, який можна використовувати будь-де та будь-коли.
- Конвертер Python PDF в Excel
- Перетворення PDF на XLS на Python
- Перетворення PDF на XLSX на Python
- Налаштуйте перетворення PDF у Excel
- Онлайн конвертер PDF в Excel
Конвертер Python PDF в Excel
Для перетворення PDF у Excel XLS/XLSX ми використаємо Aspose.PDF for Python. Бібліотека призначена для створення, обробки та конвертації PDF-файлів із програм Python.
Використовуйте наступну команду pip, щоб установити бібліотеку з PyPI.
pip install aspose-pdf
Перетворіть PDF на Excel XLS на Python
Aspose.PDF for Python значно спростив конвертацію PDF у Excel XLS. Вам потрібно лише завантажити PDF-файл і зберегти його як XLS у потрібному місці. Щоб конвертувати PDF-файл у XLS у програмі Python, виконайте наведені нижче дії.
- Створіть екземпляр класу Document та ініціалізуйте його шляхом до вхідного файлу PDF.
- Створіть об’єкт класу ExcelSaveOptions і встановіть вихідний формат XMLSPREADSHEET2003.
- Викличте метод Document.save() із назвою вихідного файлу XLS і ExcelSaveOptions як аргументами.
У наведеному нижче прикладі коду показано, як конвертувати PDF у XLS на Python.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xls.xls"
# Відкрийте файл PDF
document = ap.Document(input_pdf)
# Створення та налаштування параметрів збереження
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
# Збережіть файл у форматі MS Excel
document.save(output_pdf, save_option)
Вхідний файл PDF
Перетворений аркуш Excel
Збережіть PDF як XLSX у Python
Ви також можете конвертувати PDF у XLSX подібним чином. У цьому випадку вам не потрібно вказувати вихідний формат. Просто збережіть перетворений файл Excel із розширенням .xlsx. Нижче наведено кроки для перетворення PDF у XLSX на Python.
- Завантажте PDF-файл за допомогою класу Document.
- Створіть об’єкт класу ExcelSaveOptions.
- Викличте метод Document.save() і передайте ім’я вихідного файлу та об’єкт DocSaveOptions як аргументи.
У наведеному нижче прикладі коду показано, як конвертувати PDF у XLSX на Python.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx.xlsx"
# Відкрийте документ PDF
document = ap.Document(input_pdf)
# Створення параметрів збереження
save_option = ap.ExcelSaveOptions()
# Збережіть файл у форматі XLSX
document.save(output_pdf, save_option)
Налаштуйте перетворення PDF у Excel
Ви також можете налаштувати перетворення PDF у Excel за допомогою різних параметрів. У наступних розділах показано, як використовувати деякі з доступних параметрів.
PDF в Excel із порожнім першим стовпцем
Цей параметр використовується для додавання порожнього першого стовпця в перетворений аркуш Excel. Щоб установити цей параметр, скористайтеся класом ExcelSaveOptions. У наступному прикладі коду показано, як використовувати цей параметр.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "sample.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_with_control_column.xls"
# Відкрийте документ PDF
document = ap.Document(input_pdf)
# Створення параметрів збереження
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.insert_blank_column_at_first = True
# Збережіть файл у форматі MS Excel
document.save(output_pdf, save_option)
Мінімізуйте кількість аркушів
За замовчуванням кожна сторінка PDF-файлу перетворюється на аркуш у файлі Excel. Однак ви можете змінити цю поведінку, щоб мінімізувати кількість аркушів у файлі Excel. Для цього вам потрібно встановити для властивості ExcelSaveOptions.minimizethenumberofworksheets значення True. У наведеному нижче прикладі коду показано, як мінімізувати кількість аркушів під час перетворення PDF у Excel.
import aspose.pdf as ap
input_pdf = DIR_INPUT + "multipage.pdf"
output_pdf = DIR_OUTPUT + "convert_pdf_to_xlsx_single_excel_worksheet.xls"
# Відкрийте документ PDF
document = ap.Document(input_pdf)
# Створення параметрів збереження
save_option = ap.ExcelSaveOptions()
save_option.format = ap.ExcelSaveOptions.ExcelFormat.XML_SPREAD_SHEET2003
save_option.minimize_the_number_of_worksheets = True
# Збережіть файл у форматі MS Excel
document.save(output_pdf, save_option)
Онлайн конвертер PDF в Excel
Якщо ви хочете конвертувати PDF-файли у формат Excel онлайн, скористайтеся нашим високоякісним і безкоштовним конвертером PDF-файлів у Excel, який розроблено з використанням бібліотеки Aspose.PDF.
Безкоштовний конвертер PDF у XLS
Ви можете отримати безкоштовну ліцензію, щоб конвертувати PDF-файли у формат Excel без обмежень оцінювання.
Ознайомтеся з конвертером PDF в Excel
Ви можете дізнатися більше про нашу PDF-бібліотеку Python, використовуючи документацію. Ви також можете повідомити нам про свої запити через наш форум.
Висновок
У цій статті ви дізналися, як конвертувати PDF-файли в Excel на Python. Ми чітко розглянули перетворення PDF у XLS і XLSX. Крім того, ви бачили, як налаштувати перетворення PDF у Excel за допомогою різних параметрів. Крім того, наприкінці надається безкоштовний онлайн-конвертер PDF у Excel, за допомогою якого можна конвертувати скільки завгодно PDF-файлів.