东方人 发表于 2020-10-2 22:44/ h2 M3 h; f1 d2 S. A% U
现在硬盘那么便宜。% E# X% m! E7 t0 Q7 c
说说我的方法吧,买个德国VPS,然后采集英语,入库。! p& W# Q7 _% f# z3 W
再翻译成德语,法语,西班牙语, ...
c$ T3 z9 |) k5 c
抱歉,资质愚钝没太明白。( h w9 M( ~4 {8 ~7 Z G
采集入库后怎么翻译? “放入不同字段。然后搞个火车头免登陆接口发布”也没明白2 x6 x, Y5 ]- S! x* `4 L
另外火车头采集千万数据的话采集排重是不是比较困难,采集也可能比较慢。 ; c' ^" d. i* \8 i# I我是想学下scrapy分布式抓取用布隆过滤器。