我有三个站点在同一个服务器上,有两个ip,其中一个站点加了SSL证书,也就是https* y$ o& \( [2 a$ j% R: U/ `
; B0 P! _' f6 D) E' U人工访问的时候,一切都是正常的。
, o, E$ m0 r) r+ O2 Q' A4 N
' J$ e4 \6 J, @' S% r) v$ T, X, K在google和bing的搜索结果中,其他两个没有加ssl证书的网站搜索结果里面,很多加了ssl的内容,但是域名还是他们自己的。
1 |) s' a0 E" a/ W7 d! t# w7 k0 j' w1 {
比如站点A是加了SSL的,B,C没有加。在site:B.com和site:C.com的结果中,很多内容是来自A的,但是域名是B和C自己的,而且前面加了https7 e& a2 d+ Y; r# l
% Y& V5 I. G% T, W( Q这个问题困扰我很久了,一切不知道怎么解决。问了digicert,他们否认是证书引起的。! R; H4 P9 [* t
8 c( B" a1 A1 P0 J& E' e- ]一直没搞懂,为什么爬虫在爬B和C时,要去抓取A的内容。6 ~9 u& Z* h+ R2 v% X
$ a9 V2 c$ L2 s3 P) Z, A7 K大神给的建议吧,多谢
0 G5 Q* L I" q/ @ c& H
. L7 t9 y: N% B0 W+ m7 j/ Z. p) K% j, K' n* f2 z
|