现在完成的工作有2个:
1、爬虫顺利的进行用户资料采集了,昨天到现在,已经采集了30万个用户资料。按照百度的说法,他们有92万人平均在线,我想了想,怎么也要采集100万到200万的用户资料回来才够用;
2、自动访问已经完成,后面有视频展示。视频上传到YouTube空间中,国内访问比较慢,需要等待较长的时间缓存。
接下来的工作是:
1、制作一个网站,网站上放一些文章和统计代码;
2、注册一个百度空间,空间里面转载一些文章,在文章中超链接到网站上,同时关注统计代码;
3、从已经爬回来的30万个用户中,随机抽取1000个进行踩脚印测试;
4、反馈效果,计算成本和效率;
1、爬虫顺利的进行用户资料采集了,昨天到现在,已经采集了30万个用户资料。按照百度的说法,他们有92万人平均在线,我想了想,怎么也要采集100万到200万的用户资料回来才够用;
2、自动访问已经完成,后面有视频展示。视频上传到YouTube空间中,国内访问比较慢,需要等待较长的时间缓存。
接下来的工作是:
1、制作一个网站,网站上放一些文章和统计代码;
2、注册一个百度空间,空间里面转载一些文章,在文章中超链接到网站上,同时关注统计代码;
3、从已经爬回来的30万个用户中,随机抽取1000个进行踩脚印测试;
4、反馈效果,计算成本和效率;
Leave a comment