我有三个站点在同一个服务器上,有两个ip,其中一个站点加了SSL证书,也就是https
7 F% w. O) ]- Q3 L0 j; r$ A8 [$ [, k' y
人工访问的时候,一切都是正常的。9 G- Q4 R2 Q# K h% @7 @4 d
9 K p! X1 b3 }# Y {* _! i在google和bing的搜索结果中,其他两个没有加ssl证书的网站搜索结果里面,很多加了ssl的内容,但是域名还是他们自己的。
. X5 ?) w5 E- \/ `3 ?$ _- Q
+ e8 a2 z$ ~7 n8 }9 |& V. c比如站点A是加了SSL的,B,C没有加。在site:B.com和site:C.com的结果中,很多内容是来自A的,但是域名是B和C自己的,而且前面加了https# x: O6 A9 x, w# x$ _) {$ O( ]
8 V$ q" K$ F4 @2 _' e O! i
这个问题困扰我很久了,一切不知道怎么解决。问了digicert,他们否认是证书引起的。* Y( a3 y0 C- J& o& e3 \
) ]& h: l, b( \, u: S: K0 y一直没搞懂,为什么爬虫在爬B和C时,要去抓取A的内容。
8 p6 V/ u# [9 B2 p7 [. @
" v- s2 d+ K) G大神给的建议吧,多谢* I( K: Z, j, y
, s. U$ t4 k+ v' i: g
! O' f: p, X- q+ p& O |