登录【楼盘网loupan.com】,地区选择【湘西】,进入一级菜单【新房】,根据条件筛选区域为【高新区】、类型为【住宅】,复制网址备用。
本教程使用八爪鱼采集器采集数据,具体步骤如下:
1.打开链接:登录八爪鱼采集器,粘贴网址,点击【开始采集】。
2.循环列表:鼠标点击网页列表中的第一个内容,弹出框中点击【选中全部】,此时数据采集界面会显示列表中的所有信息,弹出框中继续点击【循环点击每个链接】,此时在流程图中产生【循环列表】。
2.1点击元素:循环列表中默认产生【点击元素】。
2.2点击元素1:想要采集的信息在另外一个页面,则鼠标点击【详细信息】,弹出框中点击【点击该链接】,流程图中产生【点击元素1】。
2.3提取详情页数据:在弹出框中点击【自动识别网页】,数据采集界面产生若干个采集指标,根据需要进行增加、删除、修改后在弹出框中点击【生成采集设置】。
3.在弹出框中点击【保存并开始采集】,或者在软件主界面右上角分别点击【保存】【采集】。
4.选在本地采集。
5.采集完成后,数据导出为Excel格式。
流程图:打开链接–>循环列表(点击元素、点击元素1、提取详情页数据)–>结束
打开导出的Excel电子表格,对所有指标数据进行分析,清洗有用的数据,变为数字格式,方面排序、计算、汇总,数据清洗好之后备份备用。
使用FineReport创建普通报表,生成效果如下: