Chủ Nhật, 8 tháng 7, 2012

Get tất cả link từ một URL


List allUrls = new List();
            WebClient client = new WebClient();
            string content = client.DownloadString("http://code2code.info");
            string pattern = @"(?i)(?s)]+?href=""?(?[^""]+)""?>(?.+?)";
            MatchCollection result = Regex.Matches(content, pattern);

            foreach (Match match in result)
            {
                string url = match.Groups["url"].Value;

                if (url.IndexOf("http://") != -1)
                {
                    allUrls.Add(url);
                }
                Console.WriteLine(url);
            }
            Console.Read();
        }
    }
}

Không có nhận xét nào: