Java でのドキュメントの分割

文書を分解することは、情報を扱い、データを扱う上で重要な仕事です。これは、長いテキストやファイルを管理しやすいように小さな部分に分割することを意味します。通常、ドキュメントは各ページまたは一連のページごとに分割されます。大量の研究論文、長いレポート、または一連のデータがある場合でも、文書を分割すると整理しやすくなります。この記事では、Java でドキュメントを分割するための便利なツール セットを紹介します。こうすることで、Word、PDF、Excel、PowerPoint 形式のドキュメントを分割できるようになります。

ドキュメントを分割するための Java API

Aspose は、ドキュメントを迅速かつ正確に小さな部分に分割するための API を提供する大手企業です。テキスト ファイル、スプレッドシート、PPT プレゼンテーションのいずれを使用している場合でも、Aspose の API を使用すると、プログラマはドキュメント分割タスクを簡単に行うことができます。これらのドキュメント分割ライブラリを調べて、Java でさまざまなタイプのドキュメントを分割する方法を見てみましょう。

Java での PDF ドキュメントの分割

Java PDF の分割

PDF (Portable Document Format) は、ドキュメントの印刷および共有に推奨される形式です。異なるプラットフォーム間でもレイアウトが一貫しているため、ドキュメント共有の頼りになるソリューションになります。 Java で PDF を分割したい場合、Aspose は Aspose.PDF for Java を提供しています。

Aspose.PDF for Java を使用すると、PDF ドキュメントの分割方法が容易になり、要件に応じて分割基準をカスタマイズできます。 Java で PDF を分割する手順は次のとおりです。

  • Aspose.PDF for Java をインストールします。
  • Document クラスを使用して PDF ドキュメントを読み込みます。
  • Document.getPages() を使用してページをループし、Page クラスを使用して各ページにアクセスします。
  • 反復するたびに、新しいドキュメントを作成し、現在のページをドキュメントに追加し、Document.save(String) メソッドを使用して PDF ファイルとして保存します。

次のコード サンプルは、Java での PDF ドキュメントの分割を示しています。

// 開いた文書
Document pdfDocument = new Document("input.pdf");

// ページカウンター用
int pageCount = 1;

// すべてのページをループします
for (Page pdfPage : pdfDocument.getPages()) {
	// 新しいドキュメントを作成する
	Document newDocument = new Document();

	// ドキュメントにページを追加する
	newDocument.getPages().add(pdfPage);

	// PDFとして保存
	newDocument.save("page_" + pageCount + "_out" + ".pdf");
	pageCount++;
}

[Java を使用した PDF ドキュメントの分割] に関する完全な記事をお読みください1

以下のリソースを使用して、Java PDF ドキュメント処理 API を開始してください。

Java での Word 文書の分割

Java の単語分割

Microsoft Word は現在、レポート、契約書、履歴書、その他の形式のコンテンツを含むテキスト文書を作成するために広く利用されているアプリケーションです。これらのファイルは通常、DOC および DOCX 形式で保存されます。 Microsoft Word文書を分割するには、Asposeが提供するAspose.Words for Javaを使用できます。

Aspose.Words for Java は、Word ドキュメントの生成と操作のためのさまざまな機能を網羅した堅牢なワードプロセッサ API です。 API は、Word 文書をシームレスかつ正確に分割する方法を提供します。 Aspose.Words for Java の機能を活用して、Java を使用して Word 文書を分割するプロセスを詳しく見てみましょう。

  • Aspose.Words for Javaをインストールします。
  • Document クラスを使用して Word ドキュメントを読み込みます。
  • DocumentPageSplitter クラスのオブジェクトを作成し、Document オブジェクトで初期化します。
  • ドキュメントのページを繰り返し処理します。
  • DocumentPageSplitter.getDocumentOfPage(int PageIndex) メソッドを使用して、各ページを新しい Document オブジェクトに抽出します。
  • Document.save(String) メソッドを使用して各ドキュメントを保存します。

以下の Java コード サンプルは、Word ドキュメントの分割を示しています。

// 完全な例とデータ ファイルについては、https://github.com/aspose-words/Aspose.Words-for-Java にアクセスしてください。
// Word文書を開く
Document doc = new Document("Word.docx");

// ドキュメント内のノードを個別のページに分割します。
DocumentPageSplitter splitter = new DocumentPageSplitter(doc);

// 各ページを個別のドキュメントとして保存する
for (int page = 1; page <= doc.getPageCount(); page++)
{
    Document pageDoc = splitter.getDocumentOfPage(page);
    pageDoc.save("SplitDocumentByPage_" + page + ".docx");
}

[Java を使用した Word ドキュメントの分割] に関する記事全体を読んでください2

以下のリソースを使用して、Java Word ドキュメント分割 API を開始できます。

Java での Excel スプレッドシートの分割

Java スプレッドシートの分割

MS Excel は、ワークシートやワークブック内のデータを保持、整理、管理できる強力なツールです。 MS Excel が提供するさまざまな機能を使用して、データの処理、視覚的表現の作成、数値演算の実行などを行うことができます。 Java でのスプレッドシート分割のために、Aspose は Aspose.Cells for Java を提供しています。

前述の API と同様に、Aspose.Cells for Java を使用すると、ワークブックからワークシートを簡単に分割し、別のファイルとして保存することもできます。必要な Excel ワークブックを開いて新しいスプレッドシートに分割するだけで、Java での Excel スプレッドシートの分割は完了です。

  • Aspose.Cells for Java をインストールします。
  • Workbookクラスを使用してExcelファイルを読み込みます。
  • 新しい Workbook オブジェクトを作成します。
  • ソース ワークブックから新しく作成したワークブックにシートをコピーします。
  • Workbook.save() メソッドを使用して、新しいワークブックを保存します。

以下のコード サンプルは、Java で Excel スプレッドシートを分割する方法を示しています。

// ソース Excel ワークブックをロードします
Workbook source = new Workbook("source.xls");

// 新しい Excel ワークブックを作成する
Workbook destination = new Workbook();

// ソースワークブックの最初のシートを 2 番目のワークブックにコピーします
destination.getWorksheets().get(0).copy(source.getWorksheets().get(0));

// ファイルを保存します。
destination.save("splitted.xls", FileFormatType.EXCEL_97_TO_2003);

以下にリストされているリソースを使用して、Java スプレッドシート処理 API を調べてください。

Java PowerPoint PPT 分割

Java PowerPoint の分割

PowerPoint PPT プレゼンテーションを分割するには、Aspose.Slides for Java を使用できます。これは、PPT、PPTX、PPS、POT、ODP などの PowerPoint プレゼンテーションを作成、変更、変換するための堅牢な Java API です。 Aspose.Slides for Java は、Java 開発者がさまざまなアプリケーションで PowerPoint プレゼンテーションを操作する場合に推奨される選択肢です。

それでは、Aspose.Slides for Java を使用して Java で PowerPoint PPT を分割する方法を見てみましょう。

  • Aspose.Slides for Javaをインストールします。
  • まず、PowerPoint プレゼンテーションをロードするための Presentation クラスのインスタンスを作成します。
  • 次に、Presentation.getSlides() メソッドを使用して各 ISlide をループします。
  • 各反復で次の手順を実行します。
    • Presentation クラスのインスタンスを作成します。
    • プレゼンテーションからデフォルトのスライドを削除します。
    • Presentation.getSlides().addClone(ISlide) メソッドを使用して、スライドをプレゼンテーションに追加します。
    • 最後に、Presentation.save(String, SaveFormat) メソッドを使用してプレゼンテーションを保存します。

次のコード サンプルは、Java で PowerPoint PPT を分割する方法を示しています。

// PowerPoint プレゼンテーションをロードする
Presentation presentation = new Presentation("presentation.pptx");

// プレゼンテーション内のスライドを繰り返し処理する
for (ISlide sld : presentation.getSlides()) {
	// 新しいプレゼンテーションを作成する
	Presentation newPres = new Presentation();
	
	// デフォルトのスライドを削除する
	newPres.getSlides().get_Item(0).remove();
	
	// スライドをプレゼンテーションに追加する
	newPres.getSlides().addClone(sld);
               
	// プレゼンテーションを保存する
	newPres.save(String.format("Slide_{0}.pptx", sld.getSlideNumber()), SaveFormat.Pptx);
}

Java で PPT プレゼンテーションを分割する方法 に関する記事全文をお読みください。

以下は、Java PowerPoint 処理 API について詳しく調べるために役立つリソースです。

無料ライセンスを取得する

無料ライセンスを取得して、評価制限なしでドキュメント分割を実行します。

まとめ

大きなドキュメントを小さなドキュメントに変換する必要がある場合、ドキュメントの分割がよく使用されます。これにより、ページやセクションが少ないドキュメントの取り扱いや作業が容易になります。このガイドでは、Java でさまざまなタイプのドキュメントを分割する方法を説明しました。コード例を使用して、PDF、Word ファイル、PowerPoint プレゼンテーション、Excel スプレッドシートを分割する方法を説明しました。提供されている API を Java アプリケーションに簡単に追加し、ドキュメントをシームレスに分割できます。