C# .NET での PDF から XLS

表形式のデータを PDF ドキュメントからスプレッドシートにエクスポートする必要がある場合、PDF ファイルを Excel 形式に変換することが不可欠になります。プログラマーは表形式のデータを PDF 形式で取得することが多く、そのデータを処理するには Excel 形式に変換する必要があります。それでは、.NET アプリケーション内からプログラムでそれを行う方法を見てみましょう。この記事を読むと、C# .NET で PDF を Excel XLS または XLSX に変換できるようになります。

この記事では、次の PDF から Excel への変換について説明します。

C# .NET PDF から Excel へのコンバーター - 無料ダウンロード

PDF ファイルを C# で Excel XLS/XLS に変換するには、Aspose.PDF for .NET を使用します。この API は、PDF ドキュメントの作成と操作をサポートするだけでなく、PDF ファイルを他の形式に忠実に変換することもできます。 DLL を ダウンロード するか、次のいずれかの方法で NuGet からインストールできます。

PDF から Excel へのコンバーター - NuGet パッケージ マネージャーによるインストール

  • Visual Studio でプロジェクトを開く/作成します。
  • NuGet パッケージ マネージャーに移動し、Aspose.PDF を検索します。
  • API をインストールします。

パッケージ マネージャー コンソール経由でインストールする

PM> Install-Package Aspose.PDF

C# で PDF を Excel XLS に変換する

PDF ドキュメントを XLS スプレッドシートに変換するには、PDF ファイルを読み込んで「.xls」拡張子を付けて保存するだけです。以下は、この変換を実行する手順です。

  • Document クラスを使用して PDF ファイルを読み込みます。
  • ExcelSaveOptions クラスのオブジェクトを作成します。
  • Document.Save(string, ExcelSaveOptions) メソッドを使用して PDF ファイルを Excel XLS として保存します。

次のコード サンプルは、C# で PDF を Excel XLS に変換する方法を示しています。

// PDF ドキュメントを読み込む
Document pdfDocument = new Document("sampletable.pdf");
ExcelSaveOptions options = new ExcelSaveOptions(); 
// 出力ファイルを保存
pdfDocument.Save("Excel.xls", options);

入力 PDF ドキュメント

変換された Excel XLS

C# で PDF を XLSX に変換する

デフォルトでは、Aspose.PDF は PDF ドキュメントを XLS 形式に変換します。変換された Excel スプレッドシートを XLSX 形式で取得する場合は、ExcelSaveOptions クラスを使用して指定できます。

次のコード サンプルは、C# を使用して PDF ドキュメントを XLSX 形式の Excel に変換する方法を示しています。

// PDF ドキュメントを読み込む
Document pdfDocument = new Document("sampletable.pdf");
// ExcelSaveOptions の初期化
ExcelSaveOptions options = new ExcelSaveOptions();
// 出力形式の設定
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// 出力ファイルを保存
pdfDocument.Save("Excel.xlsx", options);

C# PDF を Excel にエクスポート - 最初の列を空白にする

変換された Excel スプレッドシートに空白の最初の列を挿入することもできます。これは、ExcelSaveOptions.InsertBlankColumnAtFirst オプションを使用して行うことができます。

  • Document クラスを使用して PDF ファイルを読み込みます。
  • ExcelSaveOptions クラスのオブジェクトを作成します。
  • (オプション) ExcelSaveOptions.Format プロパティを使用して、出力 Excel 形式を XLSX に設定します。
  • ExcelSaveOptions.InsertBlankColumnAtFirst プロパティを true に設定します。
  • Document.Save(string, ExcelSaveOptions) メソッドを使用して PDF ファイルを Excel 形式で保存します。

次のコード サンプルは、PDF から Excel への変換で空白の最初の列を追加する方法を示しています。

// PDF ドキュメントを読み込む
Document pdfDocument = new Document("sampletable.pdf");
// ExcelSaveOptions の初期化
ExcelSaveOptions options = new ExcelSaveOptions();
// 出力形式の設定
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// 空白の列を最初の列としてワークシートに挿入するには 
options.InsertBlankColumnAtFirst = true;
// 出力ファイルを保存
pdfDocument.Save("Excel.xlsx", options);

C# で PDF を XLS として保存 - 最小化されたシート数

デフォルトでは、入力 PDF ドキュメントのすべてのページが個別のワークシートに変換されます。多数のページがある大きな PDF ドキュメントの場合、変換された Excel スプレッドシートには多数のワークシートも含まれます。このような場合、PDF から Excel への変換をカスタマイズして、変換されたスプレッドシートのワークシートの数を最小限に抑えることができます。このカスタマイズを実行する手順は次のとおりです。

  • Document クラスを使用して PDF ファイルを読み込みます。
  • ExcelSaveOptions クラスのオブジェクトを作成します。
  • (オプション) ExcelSaveOptions.Format プロパティを使用して、出力 Excel 形式を XLSX に設定します。
  • ExcelSaveOptions.MinimizeTheNumberOfWorksheets プロパティを true に設定します。
  • Document.Save(string, ExcelSaveOptions) メソッドを使用して、PDF ファイルを XLS/XLSX として保存します。

次のコード サンプルは、C# で PDF から Excel への変換でワークシートの数を最小限に抑える方法を示しています。

// PDF ドキュメントを読み込む
Document pdfDocument = new Document("sampletable.pdf");
// ExcelSaveOptions の初期化
ExcelSaveOptions options = new ExcelSaveOptions();
// 出力形式の設定
options.Format = ExcelSaveOptions.ExcelFormat.XLSX;
// ワークシートの数を最小限に抑える
options.MinimizeTheNumberOfWorksheets = true;
// 出力ファイルを保存
pdfDocument.Save("Excel.xlsx", options);

PDF から Excel への C# コンバーター ライブラリ - 無料ライセンスを取得

[無料の一時ライセンスを取得][17]して、評価制限なしで PDF ファイルを Excel 形式に変換できます。

続きを読む

Aspose.PDF の他の機能に興味がある場合は、ドキュメント ここ を参照してください。

結論

この記事では、C# でプログラムによって PDF ファイルを Excel 形式に変換する方法を学習しました。さらに、さまざまなオプションを使用して変換をカスタマイズする方法を見てきました。提供されているコード サンプルを .NET アプリケーションに簡単に統合できます。

関連記事

| | | | | | | | |———|———-|———-| | | Java を使用して PDF ドキュメントを Excel XLS/XLSX に変換 | C# .NET でのプログラムによる Word ドキュメントの PDF への変換 | Python で PDF ファイルをテキストに変換 | | | Java での XLSX から JSON へ | Java で Excel から JSON へ | Java での DOCX から JSON へ | | | Java での DOC から JSON へ | Java での Word から JSON へ | Java での TXT から JSON へ | | | Python での JSON から PDF へ | Java で Excel から JSON へ | Python での TXT から JSON へ | | | C# を使用して Word ドキュメントを Markdown に変換 | Java を使用して Word ドキュメントを Markdown に変換 | Python で Word ドキュメントを TIFF に変換 | | | Python で Word を HTML に変換 | C# を使用して Word を HTML に変換 | Java を使用して Word を HTML に変換 | | | Python で Word を Markdown に変換する | | | | |