• 欢迎来到老丁学习笔记

[python3]采集数据:采集链家房地产南京4982小区楼盘信息

python数据分析 laoding 3年前 (2016-11-24) 924次浏览 0个评论

前一阵子,看见有人采集各地楼盘信息比较感兴趣,闲暇时间决定自己也尝试采集一下,原本打算采集自己家的,结果发现我家楼盘在链家房产没有信息,太尴尬了!最后决定采集下南京地区的楼盘信息。

大致看了以下,南京地区链家房产总共有4982个小区,N多房源,打算分几步采集完:

第一步:采集南京各小区的一些基本信息,比如:小区楼盘均价,小区建成时间,小区成交量,小区地理位置等;

第二部:采集各个小区里的房源情况;

第三步:暂时没有想到

[采集结果]第一步小区信息采集完成,效果如下图所示(下面只是采集2页60个小区的图):

[python3]采集数据:采集链家房地产南京4982小区楼盘信息

[采集代码]采集代码如下:

[后续]

1、初步代码有不少的局限性,比如,没有设置header;

2、好久没有正儿八经地采集入库,中间出现各种问题,尴尬!看样子还是熟能生巧;

3、代码很粗糙,发出来,后续有时间完善,或者希望有缘人能够完善它;


老丁笔记,如未注明 , 均为原创,欢迎转载丨转载请注明[python3]采集数据:采集链家房地产南京4982小区楼盘信息
喜欢 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址