تصاویر معمولا برای نمایش اطلاعات مهم در اسناد Word DOC استفاده می شوند. گنجاندن تصاویر در کنار متن باعث جذابیت بیشتر محتوا می شود. در موارد خاص، ممکن است نیاز داشته باشید که تصاویر تعبیه شده در اسناد DOC را به صورت برنامه ریزی شده استخراج کنید. برای دستیابی به آن، این مقاله نحوه استخراج تصاویر از DOC در جاوا را پوشش می دهد.
Java API برای استخراج تصاویر از فایل های DOC
Aspose.Words for Java یک API قدرتمند و غنی برای ایجاد، دستکاری و تبدیل اسناد MS Word است. بنابراین، ما از این API برای استخراج تصاویر از اسناد DOC استفاده خواهیم کرد. میتوانید JAR API را دانلود کنید یا با استفاده از تنظیمات Maven زیر آن را در برنامه جاوا خود نصب کنید.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
نحوه استخراج تصاویر از DOC در جاوا
تصاویر در یک سند DOC با استفاده از اشیاء شکل نمایش داده می شوند. بنابراین، برای بازیابی تصاویر، باید هر شکل در سند را پردازش کنید. مراحل زیر برای استخراج تصاویر از یک فایل DOC در جاوا آمده است.
- ابتدا فایل DOC را با استفاده از کلاس Document بارگذاری کنید.
- سپس، تمام شکل ها را در یک NodeCollection شی با استفاده از روش Document.getChildNodes(NodeType.SHAPE، Boolean).
- از طریق اشکال بازیابی شده حلقه بزنید.
- در هر تکرار، با استفاده از روش Shape.hasImage() بررسی کنید که آیا شکل یک تصویر دارد.
- در نهایت تصویر را استخراج کرده و با استفاده از روش Shape.getImageData().save(string) ذخیره کنید.
نمونه کد زیر نحوه استخراج تصاویر از یک سند DOC در جاوا را نشان می دهد.
// سند Word را بارگیری کنید
Document doc = new Document("Document.docx");
// تمام اشکال را دریافت کنید
NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);
int imageIndex = 0;
// از میان مجموعه شکل حلقه بزنید
for (Shape shape : shapes) {
// بررسی کنید که آیا شکل دارای تصویر است
if (shape.hasImage()) {
// تصویر را استخراج و ذخیره کنید
String imageFileName = String.format(
"Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));
shape.getImageData().save(dataDir + imageFileName);
imageIndex++;
}
}
Java DOC Image Extractor - مجوز رایگان دریافت کنید
برای استفاده از Aspose.Words برای جاوا بدون محدودیت ارزیابی، یک مجوز موقت رایگان دریافت کنید.
نتیجه
در این مقاله نحوه استخراج تصاویر از یک سند DOC در جاوا را یاد گرفتید. علاوه بر این، نمونه کد نحوه استخراج تصاویر از یک فایل DOC و ذخیره آنها در محل مورد نظر را نشان داده است. علاوه بر این، Aspose.Words برای جاوا طیف گسترده ای از ویژگی ها را برای دستکاری اسناد ارائه می دهد. برای کشف این ویژگیها، میتوانید از مستندات دیدن کنید. همچنین، میتوانید سؤالات خود را از طریق [تالار گفتمان13 ما بپرسید.
همچنین ببینید
- اسناد Word را از ابتدا در جاوا ایجاد کنید
- اسناد Word را از قالب ها در جاوا ایجاد کنید
- تبدیل فایل های Word به PDF در جاوا
اطلاعات: ممکن است به یکی دیگر از API های جاوا (Aspose.Slides for Java) علاقه داشته باشید که به شما امکان می دهد ارائه ها (به PDF، اسناد word و غیره) و [وارد کردن تصاویر] را تبدیل کنید. ] یا سایر اسناد در ارائه ها.