Microsoft Word dosya biçimleri DOC/DOCX, kelime işlemcinin bilgileri düzenlemek ve açıklamak için çeşitli özellikleri desteklemesi nedeniyle ünlüdür. Aynı şekilde, HTML dosya formatı da web uygulamalarında bilgi göstermek için yararlıdır. Bu makalede, Java kullanarak Word dosyalarını (DOC/DOCX) HTML’ye veya HTML5’e dönüştürmeyi öğreneceksiniz. Aşağıda, burada keşfedeceğiniz kullanım durumları verilmiştir:

Java DOCX’ten HTML’ye veya HTML5’e Dönüştürücü - Kurulum

Her şeyden önce, uygulamalarınızda Aspose.Words for Java API’yi kolayca yapılandırabilirsiniz. JAR dosyasını, tüm API’lerin neredeyse her ay güncellendiği yeni Sürümler bölümünden indirebilirsiniz. Ayrıca Aspose tarafından sunulan Java API’lerinin tamamı Maven deposu üzerinde barındırılmaktadır. Aynı şekilde Aspose.Words for Java bağımlılığı, Maven projenizde aşağıdaki yapılandırmalarla tanımlanabilir:

Depo:

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://repository.aspose.com/repo/</url>
    </repository>
</repositories>

Bağımlılık:

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>20.6</version>
        <classifier>jdk17</classifier>
    </dependency>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>20.6</version>
        <classifier>javadoc</classifier>
    </dependency>
</dependencies>

Artık hepimiz bir Java uygulamasında DOCX’ten HTML’ye dönüştürme için hazırız.

Java kullanarak Word’ü (DOC/DOCX) HTML’ye dönüştürün

Aşağıdaki adımları izleyerek Word’ü HTML’ye dönüştürebilirsiniz:

  1. DOC veya DOCX uzantılı kaynak Word dosyasını yükleyin
  2. Dosyayı çıkış HTML’si olarak kaydedin

Aşağıdaki kod örneği, Java kullanılarak DOCX’in HTML’ye nasıl dönüştürüleceğini gösterir:

// Belgeyi diskten yükleyin.
Document doc = new Document(dataDir + "TestFile.docx");
// Belgeyi HTML'ye kaydedin.
doc.save(dataDir + "Document_out.html", SaveFormat.HTML);

DOCX dosyası Önizlemesini girin

Java'da Word'den HTML'ye

Çıktı HTML dosyası Önizleme

Java'da DOCX'ten HTML'ye

Böylece, bu ekran görüntüleri ile belge oluşturmanın yüksek doğruluğunu fark edebilirsiniz. API, metni, resimleri, tabloları ve çok daha fazlasını dönüştürme yeteneğine sahiptir.

Java kullanarak DOCX’i HTML5’e dönüştürün

HTML5, HTML’nin en son sürümüdür. Aspose.Words API’de HTML5‘yi desteklemek için tekrarlanan talepler kaydettik. Bu nedenle, DOCX’ten HTML5’e dönüştürme desteklenir ve aşağıdaki adımları izleyerek dosyaları dönüştürebilirsiniz:

  1. İlk olarak, girdi DOCX dosyasını yükleyin
  2. SaveFormat’ı ayarlarken HtmlSaveOptions’ı ayarlayın
  3. HtmlVersion.HTML5’in numaralandırma değerini ayarla
  4. Çıktı dosyasını kaydet

Aşağıdaki kod parçacığı, DOCX’in Java’da HTML5’e nasıl dönüştürüleceğini gösterir:

// Belgeyi diskten yükleyin.
Document doc = new Document(dataDir + "TestFile.docx");
HtmlSaveOptions opts = new HtmlSaveOptions(SaveFormat.HTML);
opts.setHtmlVersion(HtmlVersion.HTML_5);
opts.setExportImagesAsBase64(true);
opts.setExportPageMargins(true);        
doc.save(dataDir + "TestFile.html", opts);

Java kullanarak Parola Korumalı Word dosyasını HTML’ye dönüştürün

DOC veya DOCX dosyaları bazen parola korumalıdır veya bir parola kullanılarak şifrelenir. Bu tür dosyaları HTML’ye de dönüştürebilirsiniz. Ancak, kelime dosyasını yüklerken şifreye ihtiyacınız olacak. DOCX’ten HTML’ye dönüştürme için aşağıdaki adımları takip edebilirsiniz:

  1. İlk olarak, LoadOptions sınıfından bir nesne başlatın
  2. şifreyi ayarla
  3. Şifrelenmiş DOCX dosyasını yükleyin
  4. DOCX’i HTML’ye dönüştür

Aynı şekilde, aşağıdaki kod örneği de parola korumalı DOCX dosyasının Java kullanarak HTML’ye nasıl dönüştürüleceğini gösterir:

LoadOptions options = new LoadOptions();
options.setPassword("aspose");
// Belgeyi diskten yükleyin.
Document doc = new Document(dataDir + "TestFile.docx" , options); 
//Belgeyi HTML biçiminde kaydedin.
doc.save(dataDir + "DocxToHTML.html",SaveFormat.HTML);

Java kullanarak Word’ü MHTML’ye dönüştürün

MHTML dosyaları, gömülü içerikler ve medya içeren tek dosyalardır. Aşağıdaki adımlarla kelime dosyalarını (DOC/DOCX) MHTML’ye dönüştürebilirsiniz:

  1. Giriş DOCX dosyasını yükle
  2. Çıktı MHTML dosyasını SaveFormat.MHTML kullanarak kaydedin

Aşağıdaki kod parçacığı bu adımlara dayanmaktadır. Bu nedenle, DOCX’in Java ile MHML’ye nasıl dönüştürüleceğini gösterir:

// Word belgesini diskten yükleyin.
Document doc = new Document(dataDir + "TestFile.docx");
// Belgeyi MHTML'ye kaydedin.
doc.save(dataDir + "Document.mhtml", SaveFormat.MHTML);

Çözüm

Sonuç olarak Microsoft Word’e ihtiyaç duymadan word belgeleri dönüştürmeyi öğrendik. Örneğin, gereksinimlerinize göre DOCX’ten HTML, MHTML veya HTML5’e. Aynı şekilde dönüştürme işleminin dosya formatları arasında yüksek doğruluk ve uyumlulukla gerçekleştirildiğini ekran görüntüleri ile gözlemledik. Böylece API’yi kendi Java ortamınızda deneyebilirsiniz. Ancak API’yi kurarken veya test ederken herhangi bir sorunla karşılaşırsanız Ücretsiz Destek Forumları aracılığıyla bizimle iletişime geçebilirsiniz!

Ayrıca bakınız