Розбирання документів є важливою роботою в обробці інформації та роботі з даними. Це означає поділ довгих текстів або файлів на менші частини, якими легше керувати. Зазвичай люди поділяють документи на кожну сторінку або набір сторінок. Незалежно від того, чи є у вас багато дослідницьких робіт, довгих звітів або наборів даних, розділення документів допомагає упорядкувати все. Ця стаття познайомить вас із корисним набором інструментів для розділення документів у Java. Таким чином ви зможете розділяти документи у форматах Word, PDF, Excel і PowerPoint.
- API розділення документів Java
- Розбиття PDF-файлу в Java
- Розбиття документа Word на Java
- Розбиття електронної таблиці Excel на Java
- Розбиття PowerPoint PPT на Java
Java API для розділення документів
Aspose є провідною компанією, що пропонує API, які допомагають швидко й точно розділяти документи на менші частини. Незалежно від того, чи працюєте ви з текстовими файлами, електронними таблицями чи презентаціями PPT, API Aspose спрощують програмістам завдання розділення документів. Давайте вивчимо ці бібліотеки для розділення документів і побачимо, як розділяти різні типи документів у Java.
Розбиття PDF-документа в Java
Формат Portable Document Format (PDF) є кращим форматом для друку та обміну документами. Його узгоджене розташування на різних платформах робить його ідеальним рішенням для обміну документами. Якщо ви хочете розділити PDF-файли в Java, Aspose пропонує Aspose.PDF for Java.
Aspose.PDF for Java спрощує спосіб поділу PDF-документів і дозволяє налаштувати критерії поділу відповідно до ваших вимог. Нижче наведено кроки, які можна виконати, щоб розділити PDF-файл у Java.
- Встановіть Aspose.PDF for Java.
- Завантажте PDF-документ за допомогою класу документа.
- Переглядайте сторінки за допомогою Document.getPages() і отримуйте доступ до кожної сторінки за допомогою класу Page.
- На кожній ітерації створіть новий документ, додайте поточну сторінку до документа та збережіть її як файл PDF за допомогою методу Document.save(String).
Наведений нижче зразок коду демонструє розділення документа PDF у Java.
// відкритий документ
Document pdfDocument = new Document("input.pdf");
// Для лічильника сторінок
int pageCount = 1;
// Перегляньте всі сторінки
for (Page pdfPage : pdfDocument.getPages()) {
// Створіть новий документ
Document newDocument = new Document();
// Додати сторінку до документа
newDocument.getPages().add(pdfPage);
// Зберегти як PDF
newDocument.save("page_" + pageCount + "_out" + ".pdf");
pageCount++;
}
Прочитайте повну статтю про розбиття документів PDF за допомогою Java.
Почніть роботу з API обробки PDF-документів Java, використовуючи наведені нижче ресурси:
Розбиття документів Word на Java
Зараз Microsoft Word широко використовується для створення текстових документів, зокрема звітів, контрактів, резюме та інших форм вмісту. Ці файли зазвичай зберігаються у форматах DOC і DOCX. Щоб розділити документи Microsoft Word, ви можете використовувати Aspose.Words for Java, наданий Aspose.
Aspose.Words for Java виступає як надійний API для обробки текстів, що містить різноманітні можливості для створення та обробки документів Word. API забезпечує плавний і точний спосіб розділення документів Word. Давайте заглибимося в процес розділення документа Word за допомогою Java, використовуючи можливості Aspose.Words for Java.
- Встановіть Aspose.Words for Java.
- Завантажте документ Word за допомогою класу Document.
- Створіть об’єкт класу DocumentPageSplitter та ініціалізуйте його об’єктом Document.
- Переглядайте сторінки документа.
- Витягніть кожну сторінку в новий об’єкт Document за допомогою методу DocumentPageSplitter.getDocumentOfPage(int PageIndex).
- Збережіть кожен документ за допомогою методу Document.save(String).
Наведений нижче зразок коду Java демонструє розділення документа Word.
// Щоб отримати повні приклади та файли даних, перейдіть на сторінку https://github.com/aspose-words/Aspose.Words-for-Java
// Відкрийте документ Word
Document doc = new Document("Word.docx");
// Розділіть вузли в документі на окремі сторінки
DocumentPageSplitter splitter = new DocumentPageSplitter(doc);
// Збережіть кожну сторінку як окремий документ
for (int page = 1; page <= doc.getPageCount(); page++)
{
Document pageDoc = splitter.getDocumentOfPage(page);
pageDoc.save("SplitDocumentByPage_" + page + ".docx");
}
Прочитайте повну статтю про розбиття документів Word за допомогою Java.
Ви можете розпочати роботу з API розділення документів Java Word за допомогою наведених нижче ресурсів.
Розбиття електронної таблиці Excel на Java
MS Excel — це потужний інструмент, який дозволяє зберігати, упорядковувати та керувати даними в робочих аркушах і книгах. Ви можете використовувати різноманітні функції MS Excel для обробки даних, створення візуальних представлень, виконання числових операцій і багато іншого. Для розбиття електронних таблиць у Java Aspose надає Aspose.Cells for Java.
Так само, як API, згадані раніше, Aspose.Cells for Java також допомагає вам легко розділяти робочі аркуші з книги та зберігати їх як окремі файли. Просто відкрийте потрібну робочу книгу Excel, розділіть її на нові електронні таблиці, і ось воно – розділення електронних таблиць Excel на Java готово!
- Встановіть Aspose.Cells for Java.
- Завантажте файл Excel за допомогою класу Workbook.
- Створіть новий об’єкт Workbook.
- Скопіюйте аркуш із вихідної книги до новоствореної книги.
- Збережіть нову книгу за допомогою методу Workbook.save().
Наведений нижче зразок коду демонструє, як розділити електронну таблицю Excel у Java.
// Завантажте вихідну книгу Excel
Workbook source = new Workbook("source.xls");
// Створіть нову книгу Excel
Workbook destination = new Workbook();
// Скопіюйте перший аркуш вихідної книги в другу книгу
destination.getWorksheets().get(0).copy(source.getWorksheets().get(0));
// Збережіть файл.
destination.save("splitted.xls", FileFormatType.EXCEL_97_TO_2003);
Дослідіть API обробки електронних таблиць Java за допомогою наведених нижче ресурсів:
Java PowerPoint PPT Splitting
Щоб розділити презентації PowerPoint PPT, ви можете використовувати Aspose.Slides for Java. Це надійний Java API для створення, модифікації та перетворення презентацій PowerPoint, таких як PPT, PPTX, PPS, POT і ODP. Aspose.Slides for Java є кращим вибором для розробників Java для роботи з презентаціями PowerPoint у різних програмах.
Отже, давайте розглянемо, як розділити PowerPoint PPT у Java за допомогою Aspose.Slides for Java.
- Встановіть Aspose.Slides for Java.
- Спочатку створіть екземпляр класу Presentation, щоб завантажити презентацію PowerPoint.
- Потім прокрутіть кожен ISlide за допомогою методу Presentation.getSlides().
- У кожній ітерації виконайте такі кроки:
- Створіть екземпляр класу Presentation.
- Видаліть із презентації слайд за замовчуванням.
- Додайте слайд до презентації за допомогою методу Presentation.getSlides().addClone(ISlide).
- Нарешті, збережіть презентацію за допомогою методу Presentation.save(String, SaveFormat).
У наведеному нижче прикладі коду показано, як розділити PowerPoint PPT у Java:
// Завантажте презентацію PowerPoint
Presentation presentation = new Presentation("presentation.pptx");
// Переглядайте слайди презентації
for (ISlide sld : presentation.getSlides()) {
// Створіть нову презентацію
Presentation newPres = new Presentation();
// Видалити слайд за замовчуванням
newPres.getSlides().get_Item(0).remove();
// Додати слайд до презентації
newPres.getSlides().addClone(sld);
// Зберегти презентацію
newPres.save(String.format("Slide_{0}.pptx", sld.getSlideNumber()), SaveFormat.Pptx);
}
Прочитайте повну статтю про як розділити PPT-презентації в Java:
Нижче наведено деякі корисні ресурси, щоб дізнатися більше про API обробки Java PowerPoint.
Отримайте безкоштовну ліцензію
Отримайте безкоштовну ліцензію та виконуйте розділення документів без будь-яких обмежень оцінки.
Підводячи підсумки
Люди часто використовують розділення документів, коли їм потрібно перетворити великі документи на менші. Це полегшує роботу з документами, які мають менше сторінок або розділів. У цьому посібнику ми показали вам, як розділяти різні типи документів у Java. Ми пояснили, як розділити PDF-файли, файли Word, презентації PowerPoint і електронні таблиці Excel за допомогою прикладів коду. Ви можете легко додати надані API до своїх програм Java і легко розділити документи.