马上加入IBC程序猿 各种源码随意下,各种教程随便看! 注册 每日签到 加入编程讨论群

C#教程 ASP.NET教程 C#视频教程程序源码享受不尽 C#技术求助 ASP.NET技术求助

【源码下载】 社群合作 申请版主 程序开发 【远程协助】 每天乐一乐 每日签到 【承接外包项目】 面试-葵花宝典下载

官方一群:

官方二群:

C# 获取网页中所有新闻内容 包括图片 该怎么弄

[复制链接]
查看3202 | 回复1 | 2013-11-19 22:42:57 | 显示全部楼层 |阅读模式
获取内容后,保存sql数据库,求助高手
ibcadmin | 2013-11-19 22:52:04 | 显示全部楼层
[C#] 纯文本查看 复制代码
 /// <summary>
       /// 采集规则返回
       /// </summary>
       /// <param name="url">网址</param>
       /// <param name="rules">正则</param>
       /// <param name="title">标题_占位符</param>
       /// <param name="titleid">标题ID_占位符</param>
       /// <param name="content">内容_占位符</param>
       /// <param name="image">图片_占位符</param>
       /// <param name="imageid">图片ID_占位符</param>
       /// <returns></returns>
       public List<Dictionary<string, string>>  Common_Rules(string url, string rules,string title,string titleid,string content,string image,string imageid) 
       {
           List<Dictionary<string, string>> list = new List<Dictionary<string, string>>(); 
           WebClient web = new WebClient();
           StreamReader reader = new StreamReader(web.OpenRead(url),Encoding.UTF8);
           String Content = reader.ReadToEnd();
           MatchCollection mlist =  Regex.Matches(Content,rules);
           foreach (Match item in mlist)
           {
               Dictionary<string, string> result = new Dictionary<string, string>();
               result.Add("title", item.Groups[title].Value);
               result.Add("titleid", item.Groups[titleid].Value);
               result.Add("content", item.Groups[content].Value);
               result.Add("image", item.Groups[image].Value);
               result.Add("imageid", item.Groups[imageid].Value);
               list.Add(result);
           }
           return list;

       }


这是我自己写的采集公共类 ,  如果你已经接触采集的技术了 那你就能看懂这段代码,不懂在追问好了。

这个直接拿去用 注视
C#论坛 www.ibcibc.com IBC编程社区
C#
C#论坛
IBC编程社区
*滑块验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则