|

楼主 |
发表于 2018-1-25 14:46:19
来自手机
|
显示全部楼层
生鱼片 发表于 2018-1-25 14:06
6 L, I+ o: `! x5 ?) S% @0 U我也掉了8成 我擦. K. {+ k! h$ `. \. \5 e
我就是那种大数据量 长尾站7 u4 W- s8 T1 l, ?2 Y
2 Q( W3 _0 D- S' D6 R- O: C , [7 z' ~0 k, x- C4 ]1 b, g
关于phantomjs来爬已经是很多人头脑冒出来的第一个想法,但phantomjs产生的impressions属于不正常的,违背了AdSense的TOS,况且即使可以用phantomjs,你要不停准备各种代理IP来爬,假如爬一百万页面,220个国家,你要准备N个代理IP总共爬22亿个页面?况且每个页面爬取之间你还要设置随机间隔时间,流量你耗得起?时间你耗得起? |
|