AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

PropellerAds
Google-Bing-Mediago-Criteo开户
⚡️按条S5代理⚡️静态⚡️独享⚡️5G广告专用虚拟卡/U充值/高返点皇家代理IP⚡️#1性价比⚡️
⚡️AdsPower:安全不封号,高效自动化Google FB TK游戏代投⚡️E.PN 虚拟卡⚡️BINOM TRACKER 60% OFF!
比Adplexity还好用的Spy工具ADPLEXITY + ADVERTCN7200W全球动态不重复住宅IP代理虚拟信用卡+独立站收款
Facebook 批量上广告尤里改 - FB 稳定投放免费黑五教程(持续更新、欢迎交流)FB 三不限源头 - 自助下户充值转款
各种主页、账单户、BM户(优势)⚡️TikTok企业户,bm户,账单户IPCola原生住宅IP⚡️$1.8/条双ISPFB海外户、GG老户、TK加白老户
PTM虚拟卡[全新卡BIN+高返点]FB虚拟卡⚡️消费越多返现越多最大欧洲Nutra网盟BA找量 FB个号1块一个
TikTok2审户/老户/国内外端口/加白SX.ORG 高质量代理⚡235+ 地区GG,FB,TK, 欧美源头, 欢迎合作❤️跨境债务催收/风险代理
FB企业户海外户,授信户,TK加白户广告位出租8500万高质量住宅IP,助力各种需求虚拟卡返佣1%,国内持牌机构
查看: 13101|回复: 8

[讨论] 不能采集亚马逊?

[复制链接]

20

主题

33

广告币

233

积分

初级会员

Rank: 2

积分
233
发表于 2015-11-3 05:51:27 | 显示全部楼层 |阅读模式
今天和一个朋友说起采集亚马逊,朋友说亚马逊不允许,我看了亚马逊联盟的说明,没有看到这一条啊3 N& G7 v6 f  S# F
有经验的前辈怎么看?
. I3 x" j5 [0 U+ Y; y& [! A+ ]" Q; Y4 W* q
相关帖子
回复

使用道具 举报

2

主题

532

广告币

645

积分

中级会员

Rank: 3Rank: 3

积分
645

社区QQ达人

发表于 2015-11-3 09:26:06 | 显示全部楼层
回复 支持 反对

使用道具 举报

6

主题

114

广告币

154

积分

初级会员

技术流 / 爬虫党

Rank: 2

积分
154
发表于 2015-11-3 13:45:52 | 显示全部楼层
什么叫不允许?1 a5 y! Q6 A6 \) O5 i1 Y# [
我这边专门帮人做数据采集,监控和分析。也做过要采集亚马逊商品数据的客户阿,没什么问题。当然会有一些反爬虫的障碍。你说的不能采集的具体是指什么?

点评

我的意思是采集亚马逊做垃圾站,朋友说会被k 前辈怎么破亚马逊的反爬虫的?我现在只是定时自动刷新,如果出现那个robot check就打码 有别的思路吗?  详情 回复 发表于 2015-11-4 01:54
http://www.jiashidata.com/gg/
回复 支持 反对

使用道具 举报

20

主题

33

广告币

233

积分

初级会员

Rank: 2

积分
233
 楼主| 发表于 2015-11-4 01:54:38 | 显示全部楼层
dersu 发表于 2015-11-3 13:458 f8 {. w- E/ t( C/ F8 \! X% f( ]) j
什么叫不允许?& _5 u% h) i* `9 j
我这边专门帮人做数据采集,监控和分析。也做过要采集亚马逊商品数据的客户阿,没什么问题 ...
( F0 n% M$ K" U8 }6 J
我的意思是采集亚马逊做垃圾站,朋友说会被k; k9 x$ q- b1 h5 n, g
前辈怎么破亚马逊的反爬虫的?我现在只是定时自动刷新,如果出现那个robot check就打码" x" N! J# {. _% j6 u
有别的思路吗?

点评

量不大的话,楼下 @阿百川 兄弟说的是正解 否则你肯定会碰上RobotCheck,或者0或空字段 但API的限制我没记错的话是1秒,大数据级的话基本是会把自己憋屈死的 我这边因为同时为客户跑非常多的爬虫,常规有一个大概2  详情 回复 发表于 2015-11-4 16:52
回复 支持 反对

使用道具 举报

54

主题

9

广告币

6010

积分

禁止访问

积分
6010
发表于 2015-11-4 10:31:56 | 显示全部楼层
feego 发表于 2015-11-4 01:544 t2 p# \4 e0 {; z8 v
我的意思是采集亚马逊做垃圾站,朋友说会被k$ N  w6 J" H+ ^! k- E4 \
前辈怎么破亚马逊的反爬虫的?我现在只是定时自动刷新,如果 ...
' ]4 P! k3 _# Y$ `% J
amazon有api,不用自己去采集

点评

亚马逊本身的api限制太多,对我来说基本无用  详情 回复 发表于 2015-11-5 03:39
回复 支持 反对

使用道具 举报

2

主题

1475

广告币

1818

积分

高级会员

Rank: 4

积分
1818

社区QQ达人

发表于 2015-11-4 10:36:49 | 显示全部楼层
把amazon的sitemap下载下来,然后通过里面的product url进行采集相关的数据
回复 支持 反对

使用道具 举报

6

主题

114

广告币

154

积分

初级会员

技术流 / 爬虫党

Rank: 2

积分
154
发表于 2015-11-4 16:52:59 | 显示全部楼层
feego 发表于 2015-11-4 01:549 C: V4 S. t& R5 G, I+ Y
我的意思是采集亚马逊做垃圾站,朋友说会被k$ Q7 z2 c5 q5 ^1 z: ]0 U
前辈怎么破亚马逊的反爬虫的?我现在只是定时自动刷新,如果 ...

8 {  l' I. Z$ A  \, Y8 J量不大的话,楼下 @阿百川 兄弟说的是正解
$ h4 W- O+ j! p4 d否则你肯定会碰上RobotCheck,或者0或空字段
' x, @" o5 o4 R! r9 K但API的限制我没记错的话是1秒,大数据级的话基本是会把自己憋屈死的
8 h  l" O1 ?7 S* ^
. O8 {% I$ d7 t我这边因为同时为客户跑非常多的爬虫,常规有一个大概2万的匿名代理池,一般有客户要爬东西,直接先上代理池大并发,如果不行再仔细研究网站和其他方法,如果每一个网站都仔细研究他们反爬技术的话,会累死的,呵呵6 G* n1 _3 o! c7 P- Y
! K; ?. s  E4 p5 }: F' b
@李小冲 说的方法如果你没试过也一定要试一下,能减少很大工作量
3 \  R& H6 t1 m% x, C6 r
; P" K1 r; P5 a7 O2 d% W4 M# w通常来说,爬一个网站之前,先看这三点:有没有API, 有没有Mobile站,有没有sitemap,吃过无数次亏的血泪经验,哈

点评

多谢~~~~~~~~~~~~~~~~  详情 回复 发表于 2015-11-5 03:42
http://www.jiashidata.com/gg/
回复 支持 反对

使用道具 举报

20

主题

33

广告币

233

积分

初级会员

Rank: 2

积分
233
 楼主| 发表于 2015-11-5 03:39:11 来自手机 | 显示全部楼层
阿百川 发表于 2015-11-4 10:31
/ b9 k5 q1 S" [' z' ^5 a; Z0 {9 v* g/ wamazon有api,不用自己去采集

* j9 T3 `, e+ }! W& @  z9 K亚马逊本身的api限制太多,对我来说基本无用
回复 支持 反对

使用道具 举报

20

主题

33

广告币

233

积分

初级会员

Rank: 2

积分
233
 楼主| 发表于 2015-11-5 03:42:42 来自手机 | 显示全部楼层
dersu 发表于 2015-11-4 16:525 O6 E9 l( M4 X( Y1 k
量不大的话,楼下 @阿百川 兄弟说的是正解- v! z4 B1 h- W9 c! D% L, Q" x7 z
否则你肯定会碰上RobotCheck,或者0或空字段
( H; K8 V# A* Q' H但API的限制我没 ...

) Q: J. v4 A9 c% n) L9 H, t# o多谢~~~~~~~~~~~~~~~~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2026-4-20 08:24 , Processed in 0.150927 second(s), 23 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表