我有三个站点在同一个服务器上,有两个ip,其中一个站点加了SSL证书,也就是https3 z9 G; ~/ C9 m' ^' R
2 ~0 i! R5 K' X/ q, f* t人工访问的时候,一切都是正常的。5 f, C9 y T# H6 M+ t3 g' z
# ]: d9 Y; H* \, N- N在google和bing的搜索结果中,其他两个没有加ssl证书的网站搜索结果里面,很多加了ssl的内容,但是域名还是他们自己的。$ W( F& e5 ?1 _9 @/ A6 e1 v3 t# f1 o
$ x. J# e# o4 H. U& a
比如站点A是加了SSL的,B,C没有加。在site:B.com和site:C.com的结果中,很多内容是来自A的,但是域名是B和C自己的,而且前面加了https: o, _( [; v; Q0 [! S9 S
1 r6 [0 @ f. g6 ~! T) r) M, r8 X
这个问题困扰我很久了,一切不知道怎么解决。问了digicert,他们否认是证书引起的。, W, H" G' k' c- S& G
, u6 B$ i1 m- ?2 W5 @; U& ^
一直没搞懂,为什么爬虫在爬B和C时,要去抓取A的内容。; n7 p: h8 e$ [% m
) ^* f6 a) j; v& B/ h
大神给的建议吧,多谢
. o/ F, P( H' r; W n! ^, w f( M" J9 O$ c+ ?( @2 }
$ h5 w+ i0 o: _
|