C# ile Web Sayfası İçerik Okuma ( HTML )


wesite-icerik-okuma

C# ile web sayfalarından içerik çekebilirsiniz.

Öncelikle çekmek istediğiniz içeriği belirleyin.

Sonrasında sayfaya sağ tıklayarak kaynak koduna erişin.

İstediğiniz içeriğin hangi html kodları arasında olduğunu belirleyin. (kodda start ve end olarak tanımlanacak.)

Sonrasında sayfanın tamamını okuyup ihtiyacımız olan kısmı alacağız.

Alırken dikkat etmemiz gerek kısım karakterleri türkçe formatta çekmemiz. (Encoding.GetEncoding(“windows-1254”) )


using System.IO;  

	url = "http://www.icerikokunacak.com/";
        WebRequest req = HttpWebRequest.Create(url); 
        WebResponse res;
        try
        {
            res = req.GetResponse();

            StreamReader data = new StreamReader(res.GetResponseStream(), System.Text.Encoding.GetEncoding("windows-1254")); 
            string icerik = data.ReadToEnd();

            int start = icerik.IndexOf("<h1>") + 4; 
            int end = icerik.IndexOf("</h1>"); 
            string h1 = icerik.Substring(start, end - start); 
            richTextBox1.Text = h1; 
} 
catch
{ richTextBox1.Text = "Sayfa okunamadı!"; }

Reklamlar

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Google+ fotoğrafı

Google+ hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Connecting to %s