AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G⚡️最干净<Wifi住宅+5G移动>IP代理泰国仓储,本土仓发货2-3元/单
指纹浏览器,就用AdsPower谷歌/FB/Bing/Yahoo代理商开户7200W全球动态不重复住宅IP代理全球优质流量,选TrafficStars
出售Facebook,友缘号,FB广告号,insFB/TT/KW 加白开户ADPLEXITY + ADVERTCN比Adplexity还好用的Spy工具
广
FB/Google/TK海外多媒体极速下户
BINOM TRACKER 60% OFF!MediaGo+Taboola+Ob开户百度国际MediaGo⚡️让产品狂奔全球百度国际,高点击转化,快速放量
百度国际MediaGo,独家原生流量虚拟信用卡+独立站收款行业首创新型指纹Cloak, 谷歌奇效!Kookeey⚡️100%独享⚡️原生住宅IP
⚡IPFoxy住宅代理全场88折⚡全球虚拟卡, 支持U充值免账户投放 FB 广告(送项目)2024做什么 - Media buy 项目库
免费黑五教程(持续更新、欢迎交流)Facebook 批量上广告Bridgeway - 联盟营销网络IPCola 全新住宅代理 ⚡️ 免费试用
各种主页、账单户、BM户(优势)⚡️个人户,bm户不限额,账单户Adsterra 的CPA/CPM/CPC 网站流量在线注册美国/英国/香港等海外公司
EU KETO/CBD - JumbleberryFB二三解1元/个9Proxy ⚡️ $0.04/IP, 无限带宽 cloak斗篷/ss/nutra/cpa/Dating
E.PN 虚拟卡Asocks代理服务器$3/GB高薪诚求实力FB投手(独立站)《全新虚拟卡+全球收付款》
广告位出租全球低价纯净住宅/移动IP-免费试用广告代投, 东南亚物流, 虚拟信用卡VMLogin指纹浏览器+多账号防关联
查看: 24530|回复: 35

[讨论] 从Google爬了点数据搞了个PDF下载站

[复制链接]

2

主题

220

广告币

345

积分

初级会员

Rank: 2

积分
345
发表于 2019-3-21 09:24:34 | 显示全部楼层 |阅读模式
adsterra
原理我上一个帖子说过了,就是通过关键词爬取Google的搜索页面。由于是PDF下载站,所以只爬取了PDF的搜索结果,爬了大概120万页数据。然后就是把PDF文档转成图片,这个工作量比较大,CPU一直100%运行。
: |( u- S- g9 ^( D: l6 F  X( D$ S" |# n
基本原理就这些,刚搞的新站也没流量,贴出来大家看看,https://www.zoompdf.com
! r* n7 x: a5 ^; ?7 @$ ]
; I; s, d$ ]( `. t# I后面的工作就是搞流量,小伙伴们多提提建议,欢迎小伙伴找我吹牛。
! d3 H! Y5 v6 s$ _% B$ Y  h
/ g, y8 p* H" ]' Z5 L3 F- C/ {
相关帖子
回复

使用道具 举报

36

主题

738

广告币

906

积分

中级会员

Rank: 3Rank: 3

积分
906

社区QQ达人

发表于 2019-3-21 20:43:58 | 显示全部楼层
本帖最后由 fs8908336 于 2019-3-22 12:44 编辑
2 ?6 k0 ]+ a4 M
osun 发表于 2019-3-21 20:37
  G  {# P* k# r. `( Z6 h兄弟,能不能给点做外链的思路啊

0 Y$ Z# q/ Y+ D3 ^$ I9 `) O9 R  r
给你两个我测试过的办法:
4 A# I( c/ R0 @' Z' R一个是Quora上回答问题,然后ref自己网站的链接,当然你要保证你引用的和你网站上的PDF内容有关。这样获得的外链是nofollow的,但是带来的是有效流量。
$ S: S* A# b  h0 k4 n, q' _另外一个是steemit.com,发表一个全是外链的文章,然后找steemit robot花钱买点赞,凑够10 SBD就可以了,这个可以直接拿到dofollow的外链,而且steemit.com全球排名很高,大概一千名左右,这个拿来提高pr还是可以的,但是带来不了多少流量
回复 支持 2 反对 0

使用道具 举报

2

主题

220

广告币

345

积分

初级会员

Rank: 2

积分
345
 楼主| 发表于 2019-3-21 12:07:56 | 显示全部楼层
Toogle 发表于 2019-3-21 10:280 [' w: a$ V2 ~5 U/ g2 Q+ R
文件都是哪来的?没有版权问题吗?
% ?4 B' O2 `; m( r, @; H
' q$ ^3 Y+ E% j: X! X8 D6 @' G9 Dhttp://www.advertcn.com/thread-83068-1-1.html

0 G% e& J. C8 Y. W# q文件都是从Google搜索结果里获取的,没有版权问题
回复 支持 1 反对 0

使用道具 举报

36

主题

738

广告币

906

积分

中级会员

Rank: 3Rank: 3

积分
906

社区QQ达人

发表于 2019-3-21 20:29:56 | 显示全部楼层
牛逼牛逼。1 p" }# \4 f- f8 m
看了一下,seo基本没怎么做呀,怎么着也要写个keyword和meta吧, f/ z8 w2 e1 D* J0 v
稍微做点外链,估计流量哗哗的
回复 支持 1 反对 0

使用道具 举报

73

主题

1364

广告币

2755

积分

高级会员

Rank: 4

积分
2755
发表于 2019-3-21 10:28:52 | 显示全部楼层
文件都是哪来的?没有版权问题吗?
, Z: j3 z+ n& p) i5 g2 v" ~; G  V2 y; _/ O/ u3 E
http://www.advertcn.com/thread-83068-1-1.html: z5 T8 }# p% f. M- ^$ {" P

% j3 N7 E! H/ ^7 X, M看这个帖子里提及的网站,好像就是因为版权问题被国外声讨,google一下就有了。.com可能被迫关了??现在是.net指向.org域名……4 S& O5 d) g2 O& G0 y; k7 |- m
) P; V2 [' i) d& ]6 k
关注+学习……
) m) F; T2 A& Z7 @( |' \4 |( c; b6 x8 N3 j, b# f) P

点评

文件都是从Google搜索结果里获取的,没有版权问题  详情 回复 发表于 2019-3-21 12:07
已有1人评分           广告币           理由
     河小马         +10,000,000       太帅了
回复 支持 反对

使用道具 举报

212

主题

1054

广告币

2077

积分

高级会员

Rank: 4

积分
2077
发表于 2019-3-21 10:33:52 来自手机 | 显示全部楼层
能给点流量!
回复 支持 反对

使用道具 举报

23

主题

1185

广告币

2133

积分

高级会员

Rank: 4

积分
2133

社区QQ达人

发表于 2019-3-21 13:07:37 | 显示全部楼层
本帖最后由 qiqinjun 于 2019-3-21 13:09 编辑
# |" f. F2 u( q- Z* |& g7 r1 Q. f& |9 V
这个站可以的,好好搞,但是最好是网站和数据,图片,文件这些分开存放,投诉肯定会有的,但是流量还算有点值钱的哦

点评

大佬, 为什么不用担心版权问题呢? 请详细说下可以吗?  详情 回复 发表于 2019-4-12 08:04
没有版权问题的,不用担心  发表于 2019-3-21 15:52
回复 支持 反对

使用道具 举报

73

主题

1364

广告币

2755

积分

高级会员

Rank: 4

积分
2755
发表于 2019-3-21 17:11:19 | 显示全部楼层
osun 发表于 2019-3-21 12:07  ]; \# n4 t1 h0 p
文件都是从Google搜索结果里获取的,没有版权问题

/ c4 X" {' S- a. {Google获取的,并不代表没有版权问题吧?
& J; m, _. S$ \# q6 P6 P8 q9 E
1 X/ E7 B6 _2 ^1 L5 H9 A) m* W你拿来了,从你的网站下载,不会有版权问题?
% Q* n$ b/ m6 r4 s% d% @3 a+ v
' o' ^% Z" ^& J* q7 g3 C3 K' `9 t不懂,学习……
已有1人评分           广告币           理由
     河小马         +10,000,000       太帅了
回复 支持 反对

使用道具 举报

2

主题

220

广告币

345

积分

初级会员

Rank: 2

积分
345
 楼主| 发表于 2019-3-21 18:08:03 | 显示全部楼层
Toogle 发表于 2019-3-21 17:11% S5 v1 M6 x  B* g5 Q+ j3 _
Google获取的,并不代表没有版权问题吧?
0 e$ P! ^" e8 {8 w4 U1 q& G3 q5 l& ^% {2 S& @- R( ~) h) \
你拿来了,从你的网站下载,不会有版权问题?
5 B3 \# I9 `' \
公开的数据,有版权问题的概率比较小,当然了,数据量太大,是无法完全保证的,但是这个也问题不大,有投诉就删除
回复 支持 反对

使用道具 举报

73

主题

1364

广告币

2755

积分

高级会员

Rank: 4

积分
2755
发表于 2019-3-21 18:18:26 | 显示全部楼层
osun 发表于 2019-3-21 18:08
8 ^  l: h6 e' m9 y公开的数据,有版权问题的概率比较小,当然了,数据量太大,是无法完全保证的,但是这个也问题不大,有投 ...

, e  Y( v( o! x$ e# G: {* H' g了解……
" a2 x! X) m' v. t, z) }) C
1 {; N2 M% J3 t5 j5 m域名不错,帮顶!!
已有1人评分           广告币           理由
     河小马         +10,000,000       太帅了
回复 支持 反对

使用道具 举报

2

主题

220

广告币

345

积分

初级会员

Rank: 2

积分
345
 楼主| 发表于 2019-3-21 20:37:13 | 显示全部楼层
fs8908336 发表于 2019-3-21 20:299 G2 P3 z0 X9 p9 J3 G/ z
牛逼牛逼。" n3 y' G5 ?, P, k. }  I
看了一下,seo基本没怎么做呀,怎么着也要写个keyword和meta吧+ P6 n1 l9 Z, E  {& F
稍微做点外链,估计流量哗哗的 ...

$ l+ a5 Y9 d7 i兄弟,能不能给点做外链的思路啊
回复 支持 反对

使用道具 举报

2

主题

220

广告币

345

积分

初级会员

Rank: 2

积分
345
 楼主| 发表于 2019-3-21 22:13:39 | 显示全部楼层
fs8908336 发表于 2019-3-21 20:43
: Z: }7 H1 b" e8 A给你两个我测试过的办法:
2 F% C  N0 T2 q8 v一个是Quora上回答问题,然后ref自己网站的链接,当然你要保证你引用的和你网 ...

9 j9 {5 q# C9 G. R# ~多谢了兄弟,我来试试这两个方法
回复 支持 反对

使用道具 举报

12

主题

445

广告币

1075

积分

中级会员

Rank: 3Rank: 3

积分
1075

社区QQ达人

发表于 2019-3-21 22:34:57 来自手机 | 显示全部楼层
fs8908336 发表于 2019-3-21 20:432 n3 U3 f, s2 a# v- U# b! K  C; S6 g
给你两个我测试过的办法:
, C! p6 d+ p+ m$ v一个是Quora上回答问题,然后ref自己网站的链接,当然你要保证你引用的和你网 ...

" Q5 M  v* N+ o( O. b, g7 G& G开玩笑吧,找了一批人quora上写软文一点用都没有
回复 支持 反对

使用道具 举报

52

主题

710

广告币

1370

积分

高级会员

Rank: 4

积分
1370

社区QQ达人

发表于 2019-3-21 23:24:25 | 显示全部楼层
然后我准备写个spider来爬你的站,连convert pdf 都省了。
我是C罗!!!
回复 支持 反对

使用道具 举报

21

主题

1279

广告币

2756

积分

高级会员

Rank: 4

积分
2756
发表于 2019-3-21 23:51:19 | 显示全部楼层
国外这个肯定侵权,看别人投不投诉了,敢放adsense账号试试
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2024-4-24 10:43 , Processed in 0.064234 second(s), 18 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表