如何才能使用c#实现网站数据的抓取

资料大小: 0.18 MB

所需积分: 0

下载次数:

用户评论: 0条评论,查看

上传日期: 2019-10-08

上 传 者: 易水寒 (他上传的所有资料

资料介绍

标签:HTML(92)数据采集(1295)Web(503)

  如何用c# 实现网站数据的抓取?首先大家需要清楚一点的是:任何网站的页面,无论是php、jsp、aspx这些动态页面还是用后台程序生成的静态页面都是可以在浏览器中查看其HTML源文件的。

  所以当你要开发数据采集程序的时候,你必须先对你试图采集的网站的前台页面结构(HTML)要有所了解。

  当你对要采集数据的网站里的HTML源文件内容十分熟悉之后,剩下程序上的事情就很好办了。因为C#对Web站点进行数据采集的原理就在于“把你要采集的页面HTML源文件下载下来,分析其中HTML代码然后抓取你需要的数据,最后将这些数据保存到本地文件”。

  一般情况下基本的抓取思路是:

  1)页面源文件下载

  2)页面分析采集

  页面分析就是要将网页源文件中某个特定或是唯一的字符(串)作为抓取点,以这个抓取点作为开端来截取你想要的页面上的数据。

用户评论

查看全部 条评论

发表评论请先 登录, 还没有账号?99热这里只有精品注册。

发表评论

用户评论
999re5这里只有精品交流、我要发言! 发表评论可获取积分! 请遵守相关规定。
上传99热这里只有精品资料

本月热点资料

99热这里只有精品资料热门词

最新资料

下载排行

本周

本月

总榜

行业聚焦