AdvertCN - 广告中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

Adsterra China
 谷歌+Bing+TT+MSN官方代理 
⚡️按条S5代理⚡️静态⚡️独享⚡️5G皇家代理IP⚡️#1性价比⚡️Mediabuy⚡️玩家开户首选
【鲁班跨境通-自助充值转账】FB/GG/TT❤️官方免费开户Affiliate 全媒体流量资源⚡️Taboola/Outbrain /Bing⚡️一级代理
开户投流-7*24h❤️人工在线【官方】❤️搜索套利买量投流开户独立站⚡️开户投放FB BM不限额,短id账单户
E.PN 虚拟卡DuoPlus专注打造跨境电商云手机BINOM TRACKER 60% OFF!比Adplexity还好用的Spy工具
ADPLEXITY + ADVERTCN7200W全球动态不重复住宅IP代理虚拟信用卡+独立站收款全球虚拟卡, 支持U充值
Facebook 批量上广告尤里改 - FB 稳定投放免费黑五教程(持续更新、欢迎交流)FB 三不限源头 - 自助下户充值转款
各种主页、账单户、BM户(优势)⚡️个人户,bm户不限额,账单户Google、Bing官方总代  联盟流量开户FB资源,账单户,分享户,国内一手
FB企业户BM户账单户源头海外CL企业户源头PTM全球虚拟卡—进来交个朋友!PTM虚拟卡⚡️费率透明⚡️额度随心
虚拟卡 - Pay2.House【找量】BA独家Nutra单找量广告位出租8500万高质量住宅IP,助力各种需求
虚拟卡返佣1%,国内持牌机构   
查看: 7594|回复: 10

看来采集已经不行了

[复制链接]

111

主题

531

广告币

1193

积分

中级会员

Rank: 3Rank: 3

积分
1193

社区QQ达人

发表于 2016-6-3 13:16:52 | 显示全部楼层 |阅读模式
Lemft
有一个采集站 GOOGLE有收录
& j  Z2 {2 j( E7 t: x但是无论搜什么都不会出现 甚至 用title内容加了 双引号
; {0 y# V$ K! G1 K4 _# X5 m也不会显示结果/ W8 O6 ?; u7 A3 |4 y# J7 ]
找个一篇文章 搜标题加双引号4 n/ ~8 W: [7 o( @8 R; R6 M
结果显示3000多结果,点到堤7页就没有了
2 ~6 F* O, C  @$ w* a, n8 j, s估计全部被GOOGLE列为无效内容  s1 o* P( Z" y* E6 J
$ y. b- I8 R9 r4 A
试了把网站域名换下,结果还是这样' t6 x/ K0 U8 y( x. Z/ i
不知道GOOGLE用什么办法在判断采集
3 X% d1 t, x7 l% \
6 V6 P! e. t! p* K0 {( S蛋疼。。。现在一毛流量都没' \8 H$ Y$ ~1 h# M
相关帖子
回复

使用道具 举报

7

主题

1731

广告币

2569

积分

高级会员

Rank: 4

积分
2569

社区QQ达人

发表于 2016-6-3 14:59:59 | 显示全部楼层
本帖最后由 iyahoo 于 2016-6-3 15:02 编辑 1 G; f9 f! c- N: V
; O! ?# s" b4 F9 G- t+ F! T
数据库比对 都是重复的 在就是统计学 有一两篇复制的 没有关系 如果统计结果显示 你的网站的内容 高于一定概率 都是复制的 google就会断定你这个站的内容为垃圾内容 自动降权处理。整个过程 用统计学的算法就搞定了 google的很多东西 都是使用的 统计学和概率 建好数学模型应用于搜索结果中。包括判断伪原创也是用统计搞定的,因为伪原创不符合大多数人的习惯。A词语后面大多数统计结果应该是B, 伪原创非要用C, 一两个无所谓,使用的多了就是非自然的结果。

点评

分析帝.....................  详情 回复 发表于 2016-6-3 17:42

评分

参与人数 2广告币 +3 收起 理由
ads419 + 2 一言不合就放大招
妖妖 + 1 赞一个!

查看全部评分

回复 支持 1 反对 0

使用道具 举报

16

主题

1110

广告币

2369

积分

高级会员

Rank: 4

积分
2369
发表于 2016-6-3 15:29:37 | 显示全部楼层
楼上很牛              
回复 支持 反对

使用道具 举报

42

主题

726

广告币

1031

积分

中级会员

Rank: 3Rank: 3

积分
1031

社区QQ达人

发表于 2016-6-3 15:37:08 | 显示全部楼层
本帖最后由 bluescharp 于 2016-6-3 15:40 编辑
! Y8 U) Z! c! G! o% t2 k
$ O0 k0 ?1 ]$ B/ b+ \0 K* M& t8 M其实大致的方法就那些,公开的算法都有不少。/ ?9 }" O& L+ S& @" y, M8 v- l
问题是我们知道了也没用。没有好的反制措施。相比google,我们伪原创的方法就那么些...语料库就那么少...数学模型基本没有...比如2楼说的那个markov链,其实光知道了又有什么用,我也实地测过,一样被google搞...' V$ X1 O. @/ [. w: P+ ?$ x
回复 支持 反对

使用道具 举报

220

主题

1244

广告币

2288

积分

高级会员

Rank: 4

积分
2288
发表于 2016-6-3 16:32:09 | 显示全部楼层
应该没有那么悲观吧!
回复 支持 反对

使用道具 举报

55

主题

105

广告币

647

积分

中级会员

Rank: 3Rank: 3

积分
647

社区QQ达人

发表于 2016-6-3 17:42:04 | 显示全部楼层
iyahoo 发表于 2016-6-3 14:59; G8 {, W2 |7 P9 S; ^5 q
数据库比对 都是重复的 在就是统计学 有一两篇复制的 没有关系 如果统计结果显示 你的网站的内容 高于一定 ...
& ?7 W' D; @6 }) R# u
分析帝.....................
回复 支持 反对

使用道具 举报

47

主题

403

广告币

706

积分

中级会员

Rank: 3Rank: 3

积分
706

社区QQ达人

发表于 2016-6-6 21:31:35 | 显示全部楼层
确实不行啦。
回复 支持 反对

使用道具 举报

15

主题

948

广告币

1445

积分

高级会员

Rank: 4

积分
1445

社区QQ达人

发表于 2016-6-8 19:46:46 | 显示全部楼层
额,我还等了好久,等有采集大牛跳出来拿干货打脸LZ, 到现在居然没有。难道采集真不行了?
回复 支持 反对

使用道具 举报

11

主题

370

广告币

538

积分

中级会员

Rank: 3Rank: 3

积分
538
发表于 2016-6-11 11:55:14 | 显示全部楼层
做的好的采集站,流量大都来自facebook,嗯,采集站不是不行了,是无脑式采集操作不行了

点评

net
嗯,来自社交媒体啊,相当于是内容分发了,流量不靠搜索引擎了  详情 回复 发表于 2016-6-15 16:21
回复 支持 反对

使用道具 举报

64

主题

781

广告币

1193

积分

中级会员

Rank: 3Rank: 3

积分
1193

社区QQ达人

发表于 2016-6-15 16:04:44 | 显示全部楼层
被拔毛了吧,采集肯定不行了,其实互联网内容已经很丰富了。。。。。
回复 支持 反对

使用道具 举报

64

主题

781

广告币

1193

积分

中级会员

Rank: 3Rank: 3

积分
1193

社区QQ达人

发表于 2016-6-15 16:21:47 | 显示全部楼层
刘瀚临 发表于 2016-6-11 11:55: J; |- P' _$ d5 D
做的好的采集站,流量大都来自facebook,嗯,采集站不是不行了,是无脑式采集操作不行了 ...

. N; D6 k* O& W/ V' s/ H嗯,来自社交媒体啊,相当于是内容分发了,流量不靠搜索引擎了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2025-7-9 12:24 , Processed in 0.050372 second(s), 16 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

快速回复 返回顶部 返回列表