この記事では、PDF から DOC への変換や PDF から DOCX への変換など、PDF を正確かつ簡単に Word 文書に変換する方法を紹介します。以前のバージョンの Microsoft Word では、ドキュメントは .doc 拡張子のバイナリ形式で保存されていました。 Office 2007 のリリースに伴い、Microsoft は ZIP アーカイブとしてまとめられた XML ファイルとバイナリ ファイルの組み合わせに基づく Office Open XML (OOXML) を採用しました。 MS Word は、ドキュメントを保存するためのデフォルトの拡張子として .docx を使用するようになりました。
PDF から DOC への変換、および PDF から DOCX への変換は、さまざまなシナリオで必要になる場合があります。たとえば、PDF を編集可能にしたい場合や、元の書式を維持したまま PDF のコンテンツを Word 文書に再入力したくない場合があります。別のユースケースとして、特別なソフトウェアを使用せずに PDF から DOC または DOCX への一括変換が挙げられます。このようなシナリオに注目して、この記事では、C# でのプログラムによる次の PDF から Word への変換について説明します。
- C# で PDF を DOC に変換する
- C# で PDF を DOCX に変換する
- 追加設定で PDF を DOC に変換
C# PDF から Word DOC または DOCX へのコンバーター
Aspose.PDF for .NET は、強力な PDF から DOC または DOCX へのコンバーター API を所有しており、.NET アプリケーションで PDF から Word ドキュメント を数行のコードで変換できます。 API は、WinForms、ASP.NET、Web サービス、または任意の .NET ベースのアプリケーションで使用できます。 API を ダウンロード するか、NuGet パッケージ マネージャー を使用してプロジェクトにインストールできます。
C# で PDF を DOC に変換する
以下は、Aspose.PDF for .NET を使用して PDF を DOC に変換する手順です。
- Document クラスを使用して PDF ドキュメントを読み込みます。
- Document.Save(string) メソッドを使用して、ドキュメントを .doc 拡張子で保存します。
次のコード サンプルは、C# を使用して PDF を Word DOC に変換する方法を示しています。
// 完全な例とデータ ファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET にアクセスしてください。
// ドキュメント ディレクトリへのパス。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// ソース PDF ドキュメントを開く
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");
// ファイルを MS ドキュメント形式で保存します
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);
C# で PDF を DOCX に変換する
PDF から DOCX への変換は、前述の PDF から DOC への変換に似ています。 API には DocSaveOptions クラスがあり、ドキュメント形式を DOCX に設定できます。 PDF を DOCX に変換する手順は次のとおりです。
- Document クラスを使用して PDF ドキュメントを読み込みます。
- DocSaveOptions クラスを使用して、出力ドキュメント形式を DOCX として設定します。
- Document.Save(string) メソッドを使用して、ドキュメントを .docx 拡張子で保存します。
次のコード サンプルは、C# で PDF を Word DOCX に変換する方法を示しています。
// 完全な例とデータ ファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET にアクセスしてください。
// ドキュメント ディレクトリへのパス。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// ソース PDF ドキュメントを開く
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");
// DocSaveOptions オブジェクトをインスタンス化する
DocSaveOptions saveOptions = new DocSaveOptions();
// 出力形式を DOCX として指定する
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// ドキュメントを docx 形式で保存する
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);
追加オプションで PDF を DOC に変換
Aspose.PDF for .NET は、PDF から DOC または DOCX への変換をカスタマイズするためのさまざまなオプションを提供します。 DocSaveOptions クラスは、画像解像度、行間の距離など、PDF から DOC への変換を改善または拡張するためのプロパティを公開します。次のコードは、C# で PDF を DOC に変換するときに追加のプロパティを設定する方法を示しています。 .
// 完全な例とデータ ファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET にアクセスしてください。
// ドキュメント ディレクトリへのパス。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// ソース PDF ドキュメントを開く
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");
// 保存オプションを使用して保存する
// DocSaveOptions オブジェクトを作成する
DocSaveOptions saveOptions = new DocSaveOptions();
// 認識モードをFlowに設定
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;
// 水平近接を 2.5 に設定します。
saveOptions.RelativeHorizontalProximity = 2.5f;
// 変換プロセス中に箇条書きを認識する値を有効にします
saveOptions.RecognizeBullets = true;
// 結果の DOC ファイルを保存します。
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);
結論
この記事では、C# を使用して PDF を DOC に、PDF を DOCX に変換する簡単な方法をいくつか学びました。 Aspose.PDF for .NET の強力な変換機能について詳しく知りたい場合は、API ドキュメント セクション PDF を他の形式に変換 に進んでください。 Aspose.PDF for .NET の無料コピーをダウンロードして、API ドキュメントに従ってすぐに使い始めることができます。ご不明な点がございましたら、お気軽に Aspose.PDF フォーラム に投稿してください。ご質問やご不明な点がございましたら、お気軽にお問い合わせください。