AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G⚡️AdsPower:安全不封号,高效自动化Mediabuy⚡️玩家开户首选
【鲁班跨境通-自助充值转账】FB/GG/TT❤️官方免费开户Affiliate 全媒体流量资源⚡️Taboola/Outbrain /Bing⚡️一级代理
开户投流-7*24h❤️人工在线【官方】❤️搜索套利买量投流开户独立站⚡️开户投放FB BM不限额,短id账单户
E.PN 虚拟卡BINOM TRACKER 60% OFF!比Adplexity还好用的Spy工具ADPLEXITY + ADVERTCN
7200W全球动态不重复住宅IP代理虚拟信用卡+独立站收款Facebook 批量上广告尤里改 - FB 稳定投放
免费黑五教程(持续更新、欢迎交流)FB 三不限源头 - 自助下户充值转款各种主页、账单户、BM户(优势)⚡️个人户,bm户不限额,账单户
FB资源,账单户,分享户,国内一手FB企业户,TT老户,GG老户源头海外CL企业户源头FB虚拟卡⚡️消费越多返现越多
【找量】BA独家Nutra单找量虚拟FB卡 ⚡️ 透明条件 国内外持牌,虚拟信用卡和收付款广告位出租
8500万高质量住宅IP,助力各种需求虚拟卡返佣1%,国内持牌机构  
查看: 27857|回复: 6

[讨论] 关于采集碰到cloudflare的403错误

[复制链接]

47

主题

737

广告币

988

积分

中级会员

Rank: 3Rank: 3

积分
988
发表于 2021-6-29 10:19:08 | 显示全部楼层 |阅读模式
Lemft
本帖最后由 大西瓜 于 2021-6-29 10:22 编辑 / M0 h- f& d! O; h3 _
/ c7 b2 r8 \5 s
之前一套采集规则可以正常运行,对方站点也套了cloudflare,但只需要把登陆过的cookies放进去就可以了。前段时间不行了,采集不到。用浏览器可以正常打开网页,但是用curl采集的时候,怎么样都会提示403错误,要输入验证码。请问这个是对方使用了WAF或者防爬虫的规则吗。这种情况,一般能解决吗~?( A0 V1 X% x" I( X' c/ ?4 _5 a
相关帖子
回复

使用道具 举报

36

主题

990

广告币

1745

积分

高级会员

Rank: 4

积分
1745

社区QQ达人

发表于 2021-6-29 10:56:23 | 显示全部楼层
你还能突破cloudflare的防火墙不成
2 ^0 G7 M  v  W9 F% Y1 S. @. t想起他办法吧,比如换ip什么的
回复 支持 反对

使用道具 举报

1632

主题

1万

广告币

2万

积分

管理员

宇宙无敌河马天神

Rank: 9Rank: 9Rank: 9

积分
27160

社区QQ达人

发表于 2021-6-29 13:26:59 | 显示全部楼层
做为一个长期的CF付费用户,我觉得他是屏蔽了一些user agent
) @- m; E* W9 |# }' E
! u! @0 F! r# q* G# f应该不是IP的问题
% L& g" u! A# X/ u; j% l- }9 U' k3 z& V# W  `8 G8 a' X; a
你试试轮换user agent

点评

我用的就是自己浏览器的user agent,自己浏览器能正常访问的,也没有5秒验证。换了也没啥用。更改过这个agent,ip,判断不是简单的user agent问题。也不是Ip问题。这些我在不同国家的服务器都测试过。怀疑对方用了企  详情 回复 发表于 2021-6-29 14:20
学会提问的艺术, 从小处入手, 忌大而空
AdvertCN电报群

我最喜欢用的工具
7200W全球动态不重复住宅IP代理
回复 支持 反对

使用道具 举报

47

主题

737

广告币

988

积分

中级会员

Rank: 3Rank: 3

积分
988
 楼主| 发表于 2021-6-29 14:20:09 | 显示全部楼层
本帖最后由 大西瓜 于 2021-6-29 14:29 编辑
9 A+ m5 E5 z1 R- {. U* o1 |" E
河小马 发表于 2021-6-29 13:26
6 D1 a* |% f) D做为一个长期的CF付费用户,我觉得他是屏蔽了一些user agent4 Y4 ~5 }# o8 W4 I( O0 r" W" _( ^
& {' u* e$ e2 e! i$ |4 H
应该不是IP的问题
4 a5 u4 E2 d4 a# h/ A' y
我用的就是自己浏览器的user agent,自己浏览器能正常访问的,也没有5秒验证。换了也没啥用。更改过这个agent,ip,判断不是简单的user agent问题。也不是Ip问题。这些我在不同国家的服务器都测试过。在想会不会对方启用了br压缩。我用chrome浏览器能直接打开。用IE9打开就会弹出验证码界面(还显示不出来那种)Please stand by, while we are checking your browser...

点评

CF 后台的WAF 限制里面,没有br压缩这个判断的选项 选项其实都挺简单的,你就只能一个一个的试 我自己一般是限制user agent 和 ASN  详情 回复 发表于 2021-6-29 15:57
回复 支持 反对

使用道具 举报

1632

主题

1万

广告币

2万

积分

管理员

宇宙无敌河马天神

Rank: 9Rank: 9Rank: 9

积分
27160

社区QQ达人

发表于 2021-6-29 15:57:03 | 显示全部楼层
大西瓜 发表于 2021-6-29 14:20
3 R5 G( L% b# u我用的就是自己浏览器的user agent,自己浏览器能正常访问的,也没有5秒验证。换了也没啥用。更改过这个ag ...

1 ~& r- y3 l0 c0 t: U2 v8 N/ ]5 PCF 后台的WAF 限制里面,没有br压缩这个判断的选项
4 }" m* u+ Z" p
* ]1 ~! t6 ~" ^# x: t选项其实都挺简单的,你就只能一个一个的试+ Z# {7 e% d( S: z# m
" |7 L' }" t8 }; T) q3 L. U% Y; {
我自己一般是限制user agent 和 ASN
学会提问的艺术, 从小处入手, 忌大而空
AdvertCN电报群

我最喜欢用的工具
7200W全球动态不重复住宅IP代理
回复 支持 反对

使用道具 举报

94

主题

2221

广告币

3149

积分

高级会员

Rank: 4

积分
3149

社区QQ达人

发表于 2022-10-17 15:20:52 | 显示全部楼层
本帖最后由 sead 于 2022-10-17 15:24 编辑 & S5 a7 x* ~9 {2 M' k3 S' c
0 [" ~1 Z( Y9 ]
之前用火车头碰到CF的特定规则会熄火,要专门写脚本转发后再采。
2 t8 k- B# V$ s- G7 phttps://stackoverflow.com/questi ... ile-urllib-does-not4 N) F& B$ h, d$ n  Y1 h
CF对浏览器的访问特征做了锁定
回复 支持 反对

使用道具 举报

146

主题

2528

广告币

4194

积分

金牌会员

Rank: 6Rank: 6

积分
4194
发表于 2022-10-17 16:03:02 | 显示全部楼层
还真遇到过这个问题,直接访问没有问题,用PHP采集就有出白页。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2025-8-25 08:08 , Processed in 0.056178 second(s), 19 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表