AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G⚡️最干净<Wifi住宅+5G移动>IP代理泰国仓储,本土仓发货2-3元/单
指纹浏览器,就用AdsPower谷歌/FB/Bing/Yahoo代理商开户7200W全球动态不重复住宅IP代理出售Facebook,友缘号,FB广告号,ins
FB/TT/KW 加白开户ADPLEXITY + ADVERTCN比Adplexity还好用的Spy工具广
FB/Google/TK
海外多媒体极速下户BINOM TRACKER 60% OFF!
MediaGo+Taboola+Ob开户百度国际MediaGo⚡️让产品狂奔全球百度国际,高点击转化,快速放量百度国际MediaGo,独家原生流量
虚拟信用卡+独立站收款行业首创新型指纹Cloak, 谷歌奇效!Kookeey⚡️100%独享⚡️原生住宅IP⚡IPFoxy住宅代理全场88折⚡
全球虚拟卡, 支持U充值免账户投放 FB 广告(送项目)2024做什么 - Media buy 项目库免费黑五教程(持续更新、欢迎交流)
Facebook 批量上广告Bridgeway - 联盟营销网络IPCola 全新住宅代理 ⚡️ 免费试用各种主页、账单户、BM户(优势)
⚡️个人户,bm户不限额,账单户Adsterra 的CPA/CPM/CPC 网站流量在线注册美国/英国/香港等海外公司EU KETO/CBD - Jumbleberry
FB二三解1元/个9Proxy ⚡️ $0.04/IP, 无限带宽 cloak斗篷/ss/nutra/cpa/DatingE.PN 虚拟卡
Asocks代理服务器$3/GB高薪诚求实力FB投手(独立站)《全新虚拟卡+全球收付款》广告位出租
全球低价纯净住宅/移动IP-免费试用广告代投, 东南亚物流, 虚拟信用卡VMLogin指纹浏览器+多账号防关联 
查看: 9740|回复: 8

[讨论] 不能采集亚马逊?

[复制链接]

20

主题

33

广告币

233

积分

初级会员

Rank: 2

积分
233
发表于 2015-11-3 05:51:27 | 显示全部楼层 |阅读模式
adsterra
今天和一个朋友说起采集亚马逊,朋友说亚马逊不允许,我看了亚马逊联盟的说明,没有看到这一条啊" a5 C1 c: g5 M9 l
有经验的前辈怎么看?  h' S4 b7 ^2 q! o, V. O
8 g7 H2 g8 A: `0 N3 L
相关帖子
回复

使用道具 举报

2

主题

533

广告币

644

积分

中级会员

Rank: 3Rank: 3

积分
644

社区QQ达人

发表于 2015-11-3 09:26:06 | 显示全部楼层
回复 支持 反对

使用道具 举报

6

主题

114

广告币

154

积分

初级会员

技术流 / 爬虫党

Rank: 2

积分
154
发表于 2015-11-3 13:45:52 | 显示全部楼层
什么叫不允许?& h0 k7 Y+ }9 V! x3 f
我这边专门帮人做数据采集,监控和分析。也做过要采集亚马逊商品数据的客户阿,没什么问题。当然会有一些反爬虫的障碍。你说的不能采集的具体是指什么?

点评

我的意思是采集亚马逊做垃圾站,朋友说会被k 前辈怎么破亚马逊的反爬虫的?我现在只是定时自动刷新,如果出现那个robot check就打码 有别的思路吗?  详情 回复 发表于 2015-11-4 01:54
http://www.jiashidata.com/gg/
回复 支持 反对

使用道具 举报

20

主题

33

广告币

233

积分

初级会员

Rank: 2

积分
233
 楼主| 发表于 2015-11-4 01:54:38 | 显示全部楼层
dersu 发表于 2015-11-3 13:45
" e- Z/ S. [4 Y" Z. O% O' v. ~什么叫不允许?
* d) \, R% Q, Y5 z3 P0 Q我这边专门帮人做数据采集,监控和分析。也做过要采集亚马逊商品数据的客户阿,没什么问题 ...

" p! n( ^7 |" K, ]. p7 C$ |我的意思是采集亚马逊做垃圾站,朋友说会被k
3 k4 X7 q1 F7 p前辈怎么破亚马逊的反爬虫的?我现在只是定时自动刷新,如果出现那个robot check就打码
6 Q" J5 E5 [. o2 }0 G有别的思路吗?

点评

量不大的话,楼下 @阿百川 兄弟说的是正解 否则你肯定会碰上RobotCheck,或者0或空字段 但API的限制我没记错的话是1秒,大数据级的话基本是会把自己憋屈死的 我这边因为同时为客户跑非常多的爬虫,常规有一个大概2  详情 回复 发表于 2015-11-4 16:52
回复 支持 反对

使用道具 举报

54

主题

9

广告币

6010

积分

禁止访问

积分
6010
发表于 2015-11-4 10:31:56 | 显示全部楼层
feego 发表于 2015-11-4 01:54# z2 m3 ?, P9 J
我的意思是采集亚马逊做垃圾站,朋友说会被k, ?+ S: {7 ^3 ]; i# N" j# q
前辈怎么破亚马逊的反爬虫的?我现在只是定时自动刷新,如果 ...

/ [! L* ^  w4 j& x0 T! `2 Zamazon有api,不用自己去采集

点评

亚马逊本身的api限制太多,对我来说基本无用  详情 回复 发表于 2015-11-5 03:39
回复 支持 反对

使用道具 举报

2

主题

1351

广告币

1712

积分

高级会员

Rank: 4

积分
1712

社区QQ达人

发表于 2015-11-4 10:36:49 | 显示全部楼层
把amazon的sitemap下载下来,然后通过里面的product url进行采集相关的数据
回复 支持 反对

使用道具 举报

6

主题

114

广告币

154

积分

初级会员

技术流 / 爬虫党

Rank: 2

积分
154
发表于 2015-11-4 16:52:59 | 显示全部楼层
feego 发表于 2015-11-4 01:54
+ d; W0 _# E! c4 N0 r+ N我的意思是采集亚马逊做垃圾站,朋友说会被k
4 C: ]1 d' N8 I6 [* A前辈怎么破亚马逊的反爬虫的?我现在只是定时自动刷新,如果 ...
- n9 l% o: _4 V2 X+ ?/ k  j
量不大的话,楼下 @阿百川 兄弟说的是正解
! G7 _2 k8 d+ x: Y- L否则你肯定会碰上RobotCheck,或者0或空字段/ Z* b' f( V% B* F' X6 P
但API的限制我没记错的话是1秒,大数据级的话基本是会把自己憋屈死的" X6 I2 N" `; e9 M- R* r. X) h

, v: F; @. v- x% D  z, B2 n我这边因为同时为客户跑非常多的爬虫,常规有一个大概2万的匿名代理池,一般有客户要爬东西,直接先上代理池大并发,如果不行再仔细研究网站和其他方法,如果每一个网站都仔细研究他们反爬技术的话,会累死的,呵呵' r; Z' W7 @4 a. {+ k- N

. s4 D  r9 d) f: @. q@李小冲 说的方法如果你没试过也一定要试一下,能减少很大工作量
2 H" C& {- _) I0 q8 G( q0 f
2 |0 T& E# n/ Y" p6 c5 v1 L通常来说,爬一个网站之前,先看这三点:有没有API, 有没有Mobile站,有没有sitemap,吃过无数次亏的血泪经验,哈

点评

多谢~~~~~~~~~~~~~~~~  详情 回复 发表于 2015-11-5 03:42
http://www.jiashidata.com/gg/
回复 支持 反对

使用道具 举报

20

主题

33

广告币

233

积分

初级会员

Rank: 2

积分
233
 楼主| 发表于 2015-11-5 03:39:11 来自手机 | 显示全部楼层
阿百川 发表于 2015-11-4 10:31
3 E! U! t1 @" d0 ]/ H! [amazon有api,不用自己去采集

/ H4 \$ t7 `! j4 N# l. k: l亚马逊本身的api限制太多,对我来说基本无用
回复 支持 反对

使用道具 举报

20

主题

33

广告币

233

积分

初级会员

Rank: 2

积分
233
 楼主| 发表于 2015-11-5 03:42:42 来自手机 | 显示全部楼层
dersu 发表于 2015-11-4 16:52+ U, v9 Q6 b0 m& t/ g5 S
量不大的话,楼下 @阿百川 兄弟说的是正解
! x+ y% ]% T# H; b  R否则你肯定会碰上RobotCheck,或者0或空字段
9 e3 ^' c' U1 r1 p) S" z* Z) l8 }但API的限制我没 ...

& {3 _6 ~0 p8 `  S" M- s2 z多谢~~~~~~~~~~~~~~~~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2024-5-3 13:44 , Processed in 0.053986 second(s), 16 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表