AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G需要代理IP?⚡️Proxysites.ai⚡️指纹浏览器,就用AdsPower
Mediabuy⚡️玩家开户首选【鲁班跨境通-自助充值转账】FB/GG/TT❤️官方免费开户Affiliate 全媒体流量资源⚡️
Taboola/Outbrain /Bing⚡️一级代理开户投流-7*24h❤️人工在线【官方】❤️搜索套利买量投流开户独立站⚡️开户投放
FB BM不限额,短id账单户E.PN 虚拟卡DuoPlus专注打造跨境电商云手机BINOM TRACKER 60% OFF!
比Adplexity还好用的Spy工具ADPLEXITY + ADVERTCN7200W全球动态不重复住宅IP代理虚拟信用卡+独立站收款
全球虚拟卡, 支持U充值Facebook 批量上广告尤里改 - FB 稳定投放免费黑五教程(持续更新、欢迎交流)
FB 三不限源头 - 自助下户充值转款各种主页、账单户、BM户(优势)⚡️个人户,bm户不限额,账单户9Proxy ⚡️ $0.04/IP, 无限带宽
IPCola原生住宅IP⚡️$1.8/条双ISPGoogle、Bing官方总代  联盟流量开户fb耐用号0.01一个fb账号官方合作商
FB资源,账单户,分享户,国内一手FB企业户BM户账单户源头收FB代投工作室,收TrafficFactory账号IPWO全球住宅代理⚡️免费测试⚡️
FB海外三不限-户源多 费率低PTM全球虚拟卡—进来交个朋友!PTM虚拟卡⚡️费率透明⚡️额度随心FB虚拟卡⚡️消费越多返现越多
虚拟卡 - Pay2.House【找量】Blitzads独家单子广告位出租虚拟卡返佣1%,国内持牌机构
123
返回列表 发新帖
楼主: 阿百川

[业界] 求采集ezinearticles的高招,封ip太狠了

[复制链接]

5

主题

16

广告币

89

积分

初级会员

Rank: 2

积分
89
发表于 2013-11-26 21:02:39 | 显示全部楼层
Lemft
可以修改 User Agent 为google的爬虫,它就不敢轻易的封你了
回复 支持 反对

使用道具 举报

3

主题

56

广告币

184

积分

初级会员

Rank: 2

积分
184

社区QQ达人

发表于 2013-11-26 21:14:39 | 显示全部楼层
阿百川 发表于 2013-11-26 20:54 * K: M$ H, m3 X" h# g/ s% C8 ?. W
十几万,用gg缓存采的差不多了,本来想搞整站来着

; c+ C9 r' t2 s9 Y  A! [刚找到方法采,都差不多那算了
回复 支持 反对

使用道具 举报

54

主题

9

广告币

6010

积分

禁止访问

积分
6010
 楼主| 发表于 2013-11-27 07:33:40 | 显示全部楼层
微笑君 发表于 2013-11-26 21:02 / T. @( Z; w4 ?# p4 w* @
可以修改 User Agent 为google的爬虫,它就不敢轻易的封你了
$ j: Z, b7 {" \8 e
各种爬虫、手机端的ua都试过,没用
回复 支持 反对

使用道具 举报

54

主题

9

广告币

6010

积分

禁止访问

积分
6010
 楼主| 发表于 2013-11-27 07:34:47 | 显示全部楼层
小俞 发表于 2013-11-26 21:14
4 {2 D' E- Q4 Z刚找到方法采,都差不多那算了
/ v3 G' K8 r. A& f
求方法,看看可不可以提高效率去扒整站
回复 支持 反对

使用道具 举报

SIR 该用户已被删除
发表于 2013-11-27 07:41:24 | 显示全部楼层
测试时间间隔撒,采集这个本来就是长期打算的,楼主太急了。不要一下子吃成胖子哈
回复 支持 反对

使用道具 举报

54

主题

9

广告币

6010

积分

禁止访问

积分
6010
 楼主| 发表于 2013-11-27 17:32:43 | 显示全部楼层
SIR 发表于 2013-11-27 07:41
: N$ k8 N8 `+ _/ u& ?2 E# C4 i测试时间间隔撒,采集这个本来就是长期打算的,楼主太急了。不要一下子吃成胖子哈 ...

+ O0 \* R" a7 r2 z6 T恩,看现在这批数据的处理结果如何,如果不错就慢慢采
回复 支持 反对

使用道具 举报

3

主题

3

广告币

14

积分

新手上路

Rank: 1

积分
14
发表于 2013-12-8 17:31:42 | 显示全部楼层
我曾使用的办法
/ n! e+ }2 N" F$ C" e. U1、google  iP 代理,会找到一些提供免费代理ip网站! K- t8 K* |  t! V' g; ~
2、分别打开每个网站,复制ip和端口号到excell
# i% v6 T/ M& H/ U( x0 m% @3、调整excell,最终得到一个表只有一列,形如199.199.199.199:199,过程繁琐,不过熟练了也快+ Z0 t) M6 J8 j0 z& z
4、所有的ip和端口号用逗号隔开,保存到一个文本文件
4 E$ u/ ]' g' b" e5 Z7 o" h! c5、php做一个程序,读取这个文本文件,按逗号保存到一个数组中,每次随机取出一个7 P7 F) G: c- {: G3 h/ ]
6、php写一段采集代码,用取出的这个代理ip,用完以后从数组中删除这个ip,把整个数组再用逗号隔开,保存到同名文本文件% R% I: E1 H; s, K, U0 H
7、隔几天到那几个网站,复制新的代理ip4 N7 q8 B- W! s& T/ R6 o, E* |  f0 _
8、重复以上步骤
回复 支持 反对

使用道具 举报

54

主题

9

广告币

6010

积分

禁止访问

积分
6010
 楼主| 发表于 2013-12-9 07:31:33 | 显示全部楼层
jk1s 发表于 2013-12-8 17:31
# g0 k5 u. Z- j: u& V- P( u+ O$ J; ^我曾使用的办法  D; m; J2 a2 t% A/ D
1、google  iP 代理,会找到一些提供免费代理ip网站
+ K3 Q! j( |+ p4 l) ^0 a8 R) G1 `2、分别打开每个网站,复制ip和端口号 ...

/ E4 f1 B) A) Q# ]( }也是采集的ez?多久之前?
2 q8 S( C4 V1 p# j1 U5 k8 P* ]& Q  h5 l: \
尝试过使用代理,效率很差
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2025-5-13 02:23 , Processed in 0.047958 second(s), 17 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表