Web ページは、レポート、価格リスト、または統計などの表形式データを頻繁に含んでおり、HTML テーブルでフォーマットされています。ウェブデータを扱うには、分析や報告のために HTML テーブルやページを Excel スプレッドシートに変換する必要があることが多いです。これらを Excel にエクスポートすると、ソート、フィルタリング、計算が可能になります。このプロセスを Python で自動化することで、特に大規模または繰り返しのデータセットを処理する際に、正確性が確保され、時間が節約されます。このガイドでは、わずか数行のコードで Python で HTML を Excel に変換する方法を学びます。
Python HTML to Excel Converter Library
Aspose.Cells for Python via .NET は、Python 開発者が Microsoft Excel を使用することなく Excel ファイルを作成、編集、変換できる高性能のスプレッドシート自動化ライブラリです。
さまざまなフォーマットの読み書きをサポートしており、XLS、XLSX、CSV、HTML、ODSなどが含まれます。開発者は、数式を操作し、書式を適用し、チャートを挿入し、複雑なスプレッドシートをプログラムで処理することもできます。この柔軟性により、HTMLレポートや請求書、テーブルをExcelワークブックに変換してさらなる処理や配布を行うなどの自動化タスクに最適です。
コードを書く前に、releases からダウンロードするか、PyPI からパッケージをインストールしてください。ターミナルで次のコマンドを実行します:
pip install aspose-cells-python
これにより、APIとその依存関係がインストールされ、任意のPythonプロジェクトで使用できるようになります。
HTMLをPythonでExcelに変換する
Aspose.Cells は、HTML ファイルまたは文字列を Excel ワークブックに直接変換することを可能にします。その後、XLSX、XLS、または他のサポートされている形式で保存できます。
以下の手順に従って、HTMLをロードしてExcelとして保存してください:
Workbookクラスを使用して HTML ファイルを読み込んでください。- ワークブックをXLSX形式で保存してください。
以下のコードサンプルは、HTMLファイルを読み込み、それをExcel形式にエクスポートします。
from aspose.cells import Workbook
# ステップ 1: 入力 HTML ファイルのパスを定義する
input_file = "sample.html"
# ステップ 2: Workbook オブジェクトを作成し、HTML を読み込みます
workbook = Workbook(input_file)
# ステップ 3: ファイルを Excel として保存する
workbook.save("output.xlsx")

Convert HTML to Excel using Python.
HTML 文字列を Excel に変換する
時々、HTMLコンテンツはファイルの代わりにメモリに存在します。Aspose.Cellsを使用すると、最初に保存することなく、HTML文字列を直接変換できます。このメソッドは、ウェブスクレイピングやデータ抽出スクリプトなどで、動的なHTMLコンテンツをその場でExcelファイルに変換するのに最適です。
以下の手順に従って、HTML文字列をExcelに変換します:
- ワークブックをHTMLコンテンツを含むメモリストリームを使用して初期化します。
- Save the result as an Excel file.
次のコードサンプルは、HTML文字列をExcelワークシートにエクスポートする方法を示しています:
from aspose.cells import Workbook, HtmlLoadOptions
from io import BytesIO
# ステップ 1: HTML 文字列を定義する
html_data = """
<table border='1'>
<tr><th>Product</th><th>Price</th><th>Quantity</th></tr>
<tr><td>Laptop</td><td>800</td><td>5</td></tr>
<tr><td>Phone</td><td>400</td><td>10</td></tr>
</table>
"""
# ステップ 2: HTML 文字列をバイトに変換する
html_bytes = BytesIO(html_data.encode('utf-8'))
# ステップ3: メモリからHTMLをロードする
options = HtmlLoadOptions()
workbook = Workbook(html_bytes, options)
# ステップ 4: Excel として保存
workbook.save("from_string.xlsx")

Convert HTML String to Excel using Python.
HTMLからExcelへの変換の高度なオプション
Aspose.Cells は、HTML ファイルの読み込みと保存を制御するための高度な機能を提供します。HtmlLoadOptions クラスを使用して、埋め込まれた画像、形式、またはエンコーディングを処理できます。
以下の手順に従って、HTMLファイルの読み込みをカスタマイズします:
HtmlLoadOptionsクラスのインスタンスを作成します。- HTMLロードオプションを指定します。
Workbookクラスを使用してオプションで HTML をロードします。save()メソッドを使用して Excel として保存します。
以下のコード例は、特定の設定を使用してHTMLを処理し、Excelファイルとして保存するためにHtmlLoadOptionsを使用しています。
from aspose.cells import Workbook, HtmlLoadOptions
# ステップ 1: HTML ロードオプションを設定する
load_options = HtmlLoadOptions()
load_options.auto_fit_cols_and_rows = True # Automatically adjusts columns and rows
# ステップ 2: オプションを使って HTML を読み込む
workbook = Workbook("sample.html", load_options)
# ステップ 3: Excel として保存
workbook.save("table_advanced.xlsx")

HTMLをExcelに変換するための高度なオプション。
ロードオプションを使用するタイミング
これらのオプションを使用する場合:
- あなたのHTMLには、大きなテーブルや結合されたセルが含まれています。
- 列の幅とスタイルを保持したい。
- あなたは、読みやすさを向上させるためにレイアウトを自動調整する必要があります。
HTMLを複数のExcel形式に変換する
Aspose.Cells は、ニーズに基づいて異なるスプレッドシート形式で出力を保存することを可能にします。データパイプライン、ダッシュボード、または異なるエクスポート形式を必要とする自動化ツールへの統合を可能にします。
from aspose.cells import Workbook
workbook = Workbook("sample.html")
# XLS形式で保存
workbook.save("output.xls")
# CSV形式で保存
workbook.save("output.csv")
# 報告用にPDFに保存する
workbook.save("output.pdf")
無料ライセンスを取得する
Aspose.Cells for Python via .NETを制限なく評価してください。 Aspose License Page から無料の一時ライセンスをリクエストします。それをコードに適用して、大きなファイルの処理から高度なフォーマットやグラフ操作に至るまで、すべてのプレミアム機能を探求してください。
HTMLをExcel Onlineに変換する
HTMLコンテンツを迅速にExcel形式に変換したい場合は、コードを書くことなく、Aspose.Cells HTML to Excel online converterをお試しください。
この無料のウェブアプリはあなたのブラウザで直接動作し、HTML、XLS、XLSX、CSV、ODSを含む複数のフォーマットをサポートしています。ファイルをアップロードし、出力フォーマットを選択し、変換されたExcelを即座にダウンロードできます。
Python HTML to Excel: 無料リソース
HTMLをExcelに変換することに加えて、Aspose.Cells for Python via .NETはファイル変換、チャート生成、数式、書式設定、およびピボットテーブルをサポートしています。開発者はMicrosoft OfficeなしでExcelファイルを作成または処理するためにこれを使用できます。以下のリソースを利用して、より高度な機能を探求してください:
結論
HTMLをPythonでExcelに変換することは、Webベースのデータを分析や報告環境に持ち込むための強力な方法です。Aspose.Cells for Pythonを使用すると、わずか数行のコードでこの変換を実行でき、精度、フォーマット、パフォーマンスを維持できます。データ処理スクリプトを構築する場合でも、WebレポートをExcelダッシュボードに統合する場合でも、Aspose.Cellsは必要なすべてのツールを提供します。
技術的な質問やサポートが必要ですか?私たちの Free Support Forum を訪れて、専門家と直接つながりましょう。私たちのチームは、問題を解決し、プロジェクトを通じてガイドする準備ができています。
よくある質問 (FAQs)
1. Pythonを使用してHTMLを直接Excelに変換できますか?
はい。Aspose.Cells for Python via .NETライブラリを使用して、テーブルデータを含む任意のHTMLファイルまたは文字列を直接Excelに変換できます。これはHTML構造を読み取り、出力されるExcelファイル内のテーブル、フォーマット、およびスタイルを保持します。
2. Aspose.CellsはHTML文字列をExcelに変換することをサポートしていますか?
絶対に。ファイルの代わりに、文字列やメモリストリームからHTMLコンテンツを読み込むことができます。これは、HTMLがウェブデータ、API、またはユーザー入力から動的に生成されるときに便利です。
3. XLSX以外にどの出力形式がサポートされていますか?
XLSXに加えて、HTMLをXLS、CSV、ODS、PDF、及びAspose.Cellsがサポートするその他の形式にエクスポートできます。ワークブックを保存する際に、希望する SaveFormat を指定するだけです。
4. Aspose.Cellsを使用するにはMicrosoft Excelをインストールする必要がありますか?
いいえ。Aspose.Cellsは、Microsoft ExcelやOfficeに依存しないスタンドアロンのPythonライブラリです。すべての変換を任意のシステム上でプログラム的に実行できます。
5. コーディングなしでHTMLをExcelに変換するオンラインツールはありますか?
はい、Asposeは無料の HTML to Excel online converter を提供しており、HTMLファイルをアップロードして即座にExcel出力をダウンロードできます。
6. Aspose.Cells は大きなまたは複雑な HTML テーブルを処理できますか?
はい。Aspose.Cellsは高性能なデータ処理のために設計されています。複数のテーブル、画像、または複雑なレイアウトを含む大きなHTMLファイルを効率的に処理し、正確なExcel出力を保証します。
