HTML Metni Java'yı Çıkarın

HTML, tarayıcılarda görüntülenecek belgeler oluşturmak veya tasarlamak için kullanılan bir biçimlendirme dilidir. Sayfa içerisinde metin veya görsel bilgiler içerebilir. Bazı durumlarda, HTML belgelerinden Metin çıkarmak isteyebilirsiniz. Bu tür kullanım durumlarına uygun olarak, bu makale Java’da programlı olarak HTML’den Metnin nasıl çıkarılacağını kapsar.

HTML Metin Çıkarıcı – Java API Kurulumu

Aspose.HTML for Java API; HTML, MHTML ve diğer pek çok dosya biçimini oluşturmak, düzenlemek veya değiştirmek için kullanılabilir. API’nin JAR’ını İndirilenler sayfasından indirmeniz veya pom.xml’de aşağıdaki özellikleri ekleyerek Aspose Repository‘den yüklemeniz yeterlidir.

Depo:

 <repositories>
     <repository>
         <id>snapshots</id>
         <name>repo</name>
         <url>http://repository.aspose.com/repo/</url>
     </repository>
</repositories>

Bağımlılık:

 <dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-html</artifactId>
        <version>22.7</version>
        <classifier>jdk17</classifier>
    </dependency>
</dependencies>

Java’da Programlı Olarak HTML’den Metin Çıkarma

Aşağıdaki adımlar, HTML’den Metnin Java’da programlı olarak nasıl çıkarılacağını gösterir:

  1. HTMLDocument sınıfını kullanarak kaynak HTML belgesini alın.
  2. TextSaveOptions sınıfının bir örneğini başlatın.
  3. Metni HTML belgesinden çıkarın.

Aşağıdaki kod parçacığı, HTML’den metnin Java’da programlı olarak nasıl çıkarılacağını gösterir:

// Bir HTML kodu hazırlayın ve onu dosyaya kaydedin
String code = "<span>Hello World!!</span>";
try (java.io.FileWriter fileWriter = new java.io.FileWriter("document.html")) {
    fileWriter.write(code);
}

// Dosyadan bir HTML belgesi başlat
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument("document.html");
try {
    // TextSaveOptions sınıf nesnesini başlat
    com.aspose.html.saving.TextSaveOptions options = new com.aspose.html.saving.TextSaveOptions();
    
    // HTML'yi Metne Dönüştür
    com.aspose.html.converters.Converter.convertHTML(document, options, "output.txt");
} finally {
    if (document != null) {
        document.dispose();
    }
}

Aspose.HTML for Java’yı keşfedin

API tarafından desteklenen diğer bazı özellikleri keşfetmek için belgeler bölümüne göz atabilirsiniz.

Çözüm

Sonuç olarak, Java’da programlı olarak HTML’den metin çıkarmayı öğrendiniz. Bu, web sayfalarından bilgi almanıza yardımcı olabilir. Ayrıca, endişelerinizden veya gereksinimlerinizden herhangi birini tartışmanız gerekirse forumda bize yazın.

Ayrıca bakınız