PDF から HTML

PDF から HTML への変換は、ソフトウェア、ツール、オンライン サービスなどのさまざまな手段によって実現できる、広く一般的に使用されている機能です。 PDF コンテンツをブラウザーで表示したり、Web アプリケーションの一部にしたりできるように変換する必要がある場合があります。 PDF から HTML への変換を使用すると、同様のスタイルとフォーマットを持つ HTML タグを使用して PDF コンテンツをレンダリングするというこの要件を達成できます。 Aspose のおかげで、Aspose.PDF for .NET を使用してデスクトップまたは Web アプリケーションに機能を実装できるようになりました。 API を使用すると、数行のコードを使用して PDF ドキュメントを HTML に変換できます。これだけでなく、変換中にさまざまな書式設定とスタイル オプションを指定することもできます。投稿の次のセクションでは、Aspose.PDF for .NET を使用して PDF を HTML に変換する方法についての完全なツアー ガイドを紹介します。

.NET での PDF から HTML への変換

簡単な PDF から HTML への変換は、PDF ドキュメントをロードし、HtmlSaveOptions を使用して HTML として保存することで実行できます。次の例は、変換だけでなく、画像をラスター形式で保存できる要件の指定を示しています。

// 完全な例とデータ ファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET にアクセスしてください。
// ドキュメント ディレクトリへのパス。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion_PDFToHTMLFormat();

// ソース PDF ファイル
Document doc = new Document(dataDir + "input.pdf");

// テスト済みの機能で HtmlSaveOption を作成する
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.FixedLayout = true;
saveOptions.SplitIntoPages = false;
saveOptions.RasterImagesSavingMode = HtmlSaveOptions.RasterImagesSavingModes.AsExternalPngFilesReferencedViaSvg;
              
// 出力を HTML 形式で保存する
doc.Save( dataDir + "SaveImages_out.html", saveOptions);

話はここで終わりません。 Aspose.PDF for .NET は、使いやすさを向上させるだけでなく、必要に応じて変換プロセスを完全に制御できる、大規模で最も要求の厳しい機能を提供します。このドメイン (PDF から HTML へ) の完全な機能セットを理解するために、API ドキュメントの次の優れた包括的な記事を参照できます。

上記の機能に加えて、Aspose.PDF for .NET 19.8 は、PDF から HTML への全コンテンツ幅 を保存できる新しい拡張機能をもたらします。この新機能の使用法を見てみましょう。

コンテンツ幅全体を使用した PDF から HTML への変換

API の最新バージョンでは、HTML コンテンツが左揃えで使用されているのに対し、PDF を HTML に全幅のコンテンツで変換できます。次のコード サンプルに示すように、HtmlSaveOptions クラスの FlowLayoutParagraphFullWidth プロパティを使用すると、これを実現できます。

// 完全な例とデータ ファイルについては、https://github.com/aspose-pdf/Aspose.PDF-for-.NET にアクセスしてください。
// ドキュメント ディレクトリへのパス。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.FixedLayout = (false);
saveOptions.FlowLayoutParagraphFullWidth = true;
Document doc = new Document(dataDir + "FlowLayoutParagraphFullWidth.Pdf");
doc.Save(dataDir + "FlowLayoutParagraphFullWidth_out.html", saveOptions);

さらなる改善と便利な修正

v19.8 で API がもたらす有用な改善点の次のリストにより、API の使いやすさの要素が強化されます。 +Release+Notes “Aspose.PDF for .NET 19.8 リリース ノート”):

  • テーブル機能の追加がさらに修正されました
  • フォントの置換がさらに改善されました
  • PDF に HTML を追加する際のメモリ消費量がさらに改善されました
  • PDF から画像への変換が改善されました
  • XML から PDF への変換がさらに改善されました
  • PDF から DOC/DOCX への変換が改善されました
  • テキストの追加と処理のシナリオがさらに即興で作成されました

上記のガイドで、PDF から HTML への変換のすべての側面について説明したことを願っています。ただし、まだお問い合わせがある場合は、お気軽にお問い合わせください。いつものように、お見逃しなく Aspose API に関する 1 回の更新です。エキサイティングな機能を備えた API の新しいリビジョンですぐに戻ってきます。