C#'ta Web Sayfasından Metin Çıkarma - Metin Çıkarma API'si

Bu blog yazısı, Aspose.HTML for .NET tarafından sunulan bir başka önemli özelliği göstermektedir. Bu zengin özellikli .NET kitaplığı, C# dilindeki web sayfasından programlı olarak metin çıkarmanıza olanak tanır. Ayrıca, bu metin çıkarma API’si, HTML sayfalarından metin çıkarmak için birden fazla sınıf ve yöntemi ortaya çıkardı. Böylece, yazılımınız için işletmenize rekabet avantajı sağlayacak bir web sitesi metin çıkarıcısını kolayca geliştirebilirsiniz. Bu nedenle bu makaleyi iyice inceleyin ve hiçbir bölümü kaçırmayın. Ayrıca, işlevselliği uygulamak için lütfen yerel makinenize .NET’i yüklediğinizden emin olun.

Bu blog yazısında aşağıdaki hususlar ele alınacaktır:

  1. Metin Çıkarma API Kurulumu
  2. C#‘da Web Sayfasından Metin Çıkarma - Kod Örneği
  3. Çevrimiçi Metin Çıkarıcı

Metin Çıkarma API Kurulumu

Aspose.HTML for .NET web sayfasından metin çıkarmak için kusursuz bir çözüm sunar. Bir C# programcısı olarak, üretkenliği artırmak amacıyla bir web sayfası metin çıkarıcı geliştirmek için bu metin çıkarma API’sini tercih edebilirsiniz. Ayrıca, bir web sitesi metin çıkarma API’sine ihtiyaç duyduğunuz birden fazla senaryo vardır; bu nedenle Aspose.HTML for .NET birincil tercih olabilir. Bununla birlikte, DLL dosyasını indirerek veya aşağıdaki komutu NuGet Paket Yöneticisinde çalıştırarak yükleyebilirsiniz:

PM> Install-Package Aspose.Html
metin çıkarma API'si

Kurulum talimatlarının tamamını burada inceleyebilirsiniz.

C#’ta Web Sayfasından Metin Çıkarma - Kod Örneği

Aspose.HTML for .NET kitaplığıyla çalışmak ne karmaşık ne de zordur. Dolayısıyla bu metin çıkarma API’si birinci sınıf mühendislerimiz tarafından iyi tasarlanmıştır. O halde bir kod pasajı yazmaya başlayalım.

Aşağıda belirtilen adımları takip edebilirsiniz:

  • Dizin adresini tanımlayın.
  • Bir web sayfasını yüklemek için HTMLDocument sınıfının bir yapıcısını başlatın.
  • GetElementsByTagName yöntemini çağırarak tüm h2 başlıklarını toplayın.
  • Alınan tüm h2 başlıkları arasında dolaşın.
  • GetElementsByTagName yöntemini kullanarak kalın metni alın.
  • Bir web sayfasından alınan tüm kalın metinler arasında dolaşın.
  • Metni bir Txt dosyasına kaydetmek için WriteAllText yöntemini çağırın.

Aşağıdaki kod parçacığı, C#’ta web sayfasından programlı olarak nasıl metin çıkarılacağını gösterir:

namespace Aspose.Html
{
    class HTML
    {
        // C#'ta Web Sayfasından Metin Çıkarma - Metin Çıkarma API'si
        static void Main(string[] args)
        {
            // Dizin adresini tanımlayın
            String dir = "/sample-files/";
            // Bir web sayfasını yüklemek için HTMLDocument sınıfının bir yapıcısını başlatın.  
            using (var document = new HTMLDocument("https://blog.aspose.com/tr/html/generate-pdf-from-markdown-in-java-markdown-to-pdf/"))
            {

                // GetElementsByTagName yöntemini çağırarak tüm h2 başlıklarını toplayın. 
                var headings = document.GetElementsByTagName("h2");
                String data = "********h2 headings********" + System.Environment.NewLine;
                // alınan tüm h2 başlıkları arasında döngü yapın.
               for (var i = 0; i < headings.Length; i++)
                {
                    data += headings[i].TextContent+System.Environment.NewLine;
                }
                // GetElementsByTagName yöntemini kullanarak kalın metni alın.
                var boldTags = document.GetElementsByTagName("strong");
                data += "********Bold Text********" + System.Environment.NewLine;
                // Bir web sayfasından alınan tüm kalın metinler arasında dolaşın.
               for (var i = 0; i < boldTags.Length; i++)
                {
                    data += boldTags[i].TextContent + System.Environment.NewLine;
                }
                // Metni bir txt dosyasına kaydetmek için WriteAllText yöntemini çağırın.
                File.WriteAllText(Path.Combine(dir, "data.txt"), data);
            }

        }
    }
}

Yukarıdaki kod örneğinin çıktısını aşağıdaki resimde görebilirsiniz:

web sayfasından metin çıkarma

Çevrimiçi Metin Çıkarıcı

Bu çevrimiçi web sayfası metin çıkarıcı, veri çıkarma görevlerini programlı olmayan bir şekilde gerçekleştirebileceğiniz bir araçtır. Cep telefonlarının web tarayıcısında da iyi çalışan web tabanlı bir uygulamadır. Her şeyden önce, HTML sayfalarından metin çıkarmak ücretsizdir ve çok hızlıdır. Gelecekte, bu çevrimiçi metin çıkarıcı daha fazla işlevsellikle donatılacaktır.

 çevrimiçi metin çıkarıcı

Web Sitesi Metin Çıkarıcı - Ücretsiz Lisans Alın

Bu metin ayıklamayı API değerlendirme sınırlamaları olmadan denemek için ücretsiz geçici lisans‘dan yararlanabilirsiniz.

Çözüm

Bu blog yazısı burada bitiyor. C# dilinde web sayfasından programlı olarak nasıl metin çıkarılacağını öğrendiğinizi umuyoruz. Ayrıca, HTML sayfalarından metin çıkarmanın gerçek uygulamasını da gördünüz. Aslında, hızlı uygulama geliştirme söz konusu olduğunda programcılar her zaman güvenilir ve sağlam bir API’ye yönelme eğilimindedir ve neyse ki Aspose.HTML for .NET bu işi sizin için hemen hemen yapar. Dolayısıyla, belgeler ve API’yi referanslar ziyaret ederek bu metin çıkarma API’si hakkında daha fazla bilgi edinebilirsiniz.

Son olarak aspose.com yeni makaleler yazıyor. Bu nedenle, en son güncellemeler için lütfen iletişim halinde kalın.

Yardım Mevcuttur

Sorularınızı veya sorularınızı forumumuz üzerinden bize bildirebilirsiniz.

Sıkça Sorulan Sorular – SSS

C#’ta bir Web sayfasından veri nasıl okunur?

Aspose.HTML for .NET kullanarak bir web sayfasındaki verileri programlı olarak okuyabilirsiniz. Ayrıca, nasıl uygulanacağını görmek için lütfen burayı link ziyaret edin.

C#’ta bir URL’den veri nasıl çıkarılır?

Bir web sayfasını yüklemek ve GetElementsByTagName yönteminde herhangi bir etiket adını ileterek verileri almak için HTMLDocument sınıfının bir oluşturucusunu başlatın. Ek olarak, verileri çevrimiçi olarak çıkarmak için bir çevrimiçi araçtan yararlanabilirsiniz.

Ayrıca bakınız