不能采集亚马逊？

feego · 发表于 2015-11-3 05:51:27

今天和一个朋友说起采集亚马逊，朋友说亚马逊不允许，我看了亚马逊联盟的说明，没有看到这一条啊
有经验的前辈怎么看？

凌尘 · 发表于 2015-11-3 09:26:06

可以调用吧

dersu · 发表于 2015-11-3 13:45:52

什么叫不允许？
我这边专门帮人做数据采集，监控和分析。也做过要采集亚马逊商品数据的客户阿，没什么问题。当然会有一些反爬虫的障碍。你说的不能采集的具体是指什么？

feego · 发表于 2015-11-4 01:54:38

dersu 发表于 2015-11-3 13:45
9 u6 m+ \4 D; [* [( Z0 B什么叫不允许？5 p- P& d+ L7 Q7 L2 E7 N0 e, A, W
我这边专门帮人做数据采集，监控和分析。也做过要采集亚马逊商品数据的客户阿，没什么问题 ...

我的意思是采集亚马逊做垃圾站，朋友说会被k
前辈怎么破亚马逊的反爬虫的？我现在只是定时自动刷新，如果出现那个robot check就打码
有别的思路吗？

阿百川 · 发表于 2015-11-4 10:31:56

feego 发表于 2015-11-4 01:54
B" n2 W( z# { u: \我的意思是采集亚马逊做垃圾站，朋友说会被k$ e2 O' B3 i1 x% s
前辈怎么破亚马逊的反爬虫的？我现在只是定时自动刷新，如果 ...

amazon有api，不用自己去采集

李小冲 · 发表于 2015-11-4 10:36:49

把amazon的sitemap下载下来，然后通过里面的product url进行采集相关的数据

dersu · 发表于 2015-11-4 16:52:59

feego 发表于 2015-11-4 01:54
# s6 H$ a' d6 r x4 o我的意思是采集亚马逊做垃圾站，朋友说会被k
4 ^2 }* s3 E6 [7 U前辈怎么破亚马逊的反爬虫的？我现在只是定时自动刷新，如果 ...

量不大的话，楼下 @阿百川兄弟说的是正解
否则你肯定会碰上RobotCheck，或者0或空字段
但API的限制我没记错的话是1秒，大数据级的话基本是会把自己憋屈死的

我这边因为同时为客户跑非常多的爬虫，常规有一个大概2万的匿名代理池，一般有客户要爬东西，直接先上代理池大并发，如果不行再仔细研究网站和其他方法，如果每一个网站都仔细研究他们反爬技术的话，会累死的，呵呵

@李小冲说的方法如果你没试过也一定要试一下，能减少很大工作量

通常来说，爬一个网站之前，先看这三点：有没有API, 有没有Mobile站，有没有sitemap，吃过无数次亏的血泪经验，哈

feego · 发表于 2015-11-5 03:39:11

阿百川发表于 2015-11-4 10:31
' |: {' M! Q; f$ Hamazon有api，不用自己去采集

亚马逊本身的api限制太多，对我来说基本无用

feego · 发表于 2015-11-5 03:42:42

dersu 发表于 2015-11-4 16:52
量不大的话，楼下 @阿百川兄弟说的是正解1 r3 Z' \( U& `6 F8 b
否则你肯定会碰上RobotCheck，或者0或空字段
/ F! @! m# L5 W- ?/ l- L% ?但API的限制我没 ...

多谢～～～～～～～～～～～～～～～～

		自动登录	找回密码
密码			立即注册

Google-Bing-Mediago-Criteo开户	⚡️按条S5代理⚡️静态⚡️独享⚡️5G	广告专用虚拟卡/U充值/高返点	皇家代理IP⚡️#1性价比⚡️
Mediabuy⚡️玩家开户首选	【鲁班跨境通-自助充值转账】	FB/GG/TT❤️官方免费开户	Affiliate 全媒体流量资源⚡️
Taboola/Outbrain /Bing⚡️一级代理	*开户投流-724h❤️人工在线**	【官方】❤️搜索套利买量投流开户	独立站⚡️开户投放
Google FB TK游戏代投	⚡️E.PN 虚拟卡⚡️	BINOM TRACKER 60% OFF!	比Adplexity还好用的Spy工具
ADPLEXITY + ADVERTCN	7200W全球动态不重复住宅IP代理	虚拟信用卡+独立站收款	全球虚拟卡, 支持U充值
Facebook 批量上广告	尤里改 - FB 稳定投放	免费黑五教程（持续更新、欢迎交流）	FB 三不限源头 - 自助下户充值转款
各种主页、账单户、BM户（优势）	IPCola原生住宅IP⚡️$1.8/条双ISP	FB资源，账单户，分享户，国内一手	TK加白户/二解户/FB海外户/GG老户
海外CL企业户源头	最大欧洲Nutra网盟BA找量	FB高权重耐操个号⚡️稳定过审	GG,FB,TK, 欧美源头, 欢迎合作❤️
FB企业户海外户,授信户,TK加白户	联盟收款/海外资金下发/服贸结汇	域名防红⚠斗篷工具/可试用3天	⚡️Spend.net — 美元卡仅需$0⚡️
比特浏览器+云手机 \|防关联防封号	Facebook截流, 1 次点击 2 次曝光	广告位出租	8500万高质量住宅IP，助力各种需求
虚拟卡返佣1%，国内持牌机构

[讨论] 不能采集亚马逊？

相关帖子

点评

点评

点评

点评

社区QQ达人