HTML formatı popülerdir çünkü neredeyse tüm bilgisayar ortamlarında desteklenir. WORD’den HTML’ye veya MHTML’ye dönüştürme, böyle bir dosyayı C++ kullanarak bir web uygulamasında görüntülemeniz gerektiğinde olduğu gibi senaryolarda yardımcı olur. Aspose.Words for C++ API, özellikleri ve verimliliği nedeniyle en iyi seçimdir. C++ uygulamalarınızı Microsoft Word dosyalarını (DOC/DOCX) HTML veya MHTML formatına dönüştürme özelliği ile zenginleştirebilirsiniz. Aşağıda, Word dönüşümünü ayrıntılı olarak inceleyeceğimiz bu makalenin bir taslağı yer almaktadır:

C++ Microsoft Word Dosyaları Dönüştürücü API’si – Kurulum

Microsoft Word (DOCX/DOC) dosyalarını dönüştürmek için Aspose.Words for C++ API’sini kurmamız gerekiyor. API’yi NuGet galerisinden kolayca kurabilir veya konsolda aşağıdaki komutla kurabilirsiniz.

Install-Package Aspose.Words.Cpp -Version 20.8.0

C++ kullanarak Word’ü (DOCX/DOC) HTML’ye dönüştürün

Word’den HTML’ye dönüştürme, içeriği bir tarayıcıda görüntülemek için işlemek istediğinizde yardımcı olur. C++ uygulamalarınız, aşağıdaki adımlarla dönüştürmeyi hızlı bir şekilde gerçekleştirebilir:

  1. Kaynak sözcük dosyasını yükle
  2. Belgeyi HTML biçiminde kaydedin

Aşağıdaki kod, C++ kullanarak Word’ün HTML’ye nasıl dönüştürüleceğini gösterir:

// Belgeyi şuradan yükleyin:
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Word belgesini HTML biçiminde kaydedin
doc->Save(u"Document_out.html", SaveFormat::Html);

C++ kullanarak Gömülü Yazı Tipleriyle Word’ü HTML’ye Dönüştürün

Bir kelime dosyası (DOCX/DOC), bazı platformlarda desteklenmeyen bazı özel yazı tipleri içerebilir. Bu gibi durumlarda, çıktı sonuçlarında yazı tipi bozuk görünebilir. Ancak Aspose.Words for C++ API, Base64 kodlaması kullanarak yazı tipi kaynaklarını HTML’ye gömmenizi sağlar. Yazı tiplerini çıktı HTML dosyasına gömecek olan ExportFontsAsBase64 özelliğini ayarlayabilirsiniz. Bu gereklilikleri yerine getirmek için aşağıdaki adımları izlemeniz gerekir:

  1. Kaynak DOCX dosyasını yükle
  2. ExportFontsAsBase64 özelliğini ayarlayın
  3. Çıkış HTML dosyasını kaydedin

Aşağıdaki kod parçacığı, C++ kullanarak Gömülü yazı tipleriyle Word’ün HTML’ye nasıl dönüştürüleceğini gösterir:

// Kaynak DOCX dosyasını yükle
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");

// HtmlSaveOptions nesnesini başlat
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);
        
// Çıkış HTML'sini kaydet
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

Ayrıca, HTML dosyasını Not Defteri ile düzenlerseniz veya bir tarayıcıda kaynak kodunu görürseniz, dosyaya gömülü Base64 yazı tiplerini fark edebilirsiniz. Aşağıdaki ekran görüntüsü, çıktı HTML dosyasından bir örnek gösterir:

Word'ü HTML'ye Dönüştür

C++‘da Gidiş-Dönüş Bilgileri ile Word’ü HTML’ye Dönüştürün

Microsoft Word belgeleri, aksi halde HTML dosya biçiminde desteklenmeyen pek çok bilgi ve özellik içerebilir. Bazen Word’ü HTML’ye ve ardından tekrar Word biçimine dönüştürmeniz gerekir. Bu dönüşümler arasında maksimum doğruluğu sağlamak için, “gidiş-dönüş bilgileri” olarak bilinen bazı bilgiler Aspose.Words for C++ API tarafından ek olarak kaydedilebilir. Böyle bir dönüşümü test etmek için aşağıdaki adımları takip edelim:

  1. Kaynak DOCX dosyasını yükle
  2. ExportRoundtripInformation öğesini true olarak ayarlayın
  3. Çıkış HTML dosyasını kaydedin

Aşağıdaki kod parçacığı, C++ kullanarak gidiş-dönüş bilgileriyle Word’ün HTML’ye nasıl dönüştürüleceğini gösterir:

// Giriş DOCX dosyasını yükle
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");

// HtmlSaveOptions'ı ayarlayın
System::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();
saveOptions->set_ExportFontResources(true);
saveOptions->set_ExportFontsAsBase64(true);

// Çıkış HTML dosyasını kaydet        
System::String outputPath = u"ExportFontsAsBase64.html";
doc->Save(outputPath, saveOptions);

C++ ile Word’ü MHTML’ye Dönüştürün

MHTML dosya biçimi, tek bir çıktı dosyasındaki tüm içeriği içerdiğinden popülerdir. Aşağıdaki adımlarla Word dosyasını (DOCX/DOC) C++ kullanarak MHTML formatına dönüştürebilirsiniz:

  1. Kaynak DOCX dosyasını yükle
  2. Çıktıyı MHTML biçiminde kaydet

Aşağıdaki kod parçacığı, C++ kullanarak Word’ün MHTML’ye nasıl dönüştürüleceğini gösterir:

// Belgeyi Aspose.Words'e yükleyin.
System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");

// Çıktıyı MHTML biçiminde kaydedin.
doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);

Çözüm

Word’ü (DOCX/DOC) farklı seçeneklerle HTML veya MHTML’ye dönüştürmeyi öğrendik. Gidiş-dönüş bilgilerini kaydetme veya yazı tiplerini Base64 kaynakları olarak gömme gibi çeşitli özellikler de ayrıntılı olarak tartışılmaktadır. Ancak, herhangi bir sorunuz olması durumunda lütfen Ücretsiz Destek Forumu aracılığıyla bizimle iletişime geçmekten çekinmeyin.

Ayrıca bakınız