我有三个站点在同一个服务器上,有两个ip,其中一个站点加了SSL证书,也就是https: f A0 q. w3 {& i% Q+ \5 |7 l
/ v5 v; ^1 z7 X2 b+ W! V
人工访问的时候,一切都是正常的。 * l4 F/ t! [" e8 Q0 ] 5 [9 c1 [0 V/ U0 r/ U1 z5 o1 T在google和bing的搜索结果中,其他两个没有加ssl证书的网站搜索结果里面,很多加了ssl的内容,但是域名还是他们自己的。 , K' _6 U0 Y+ \. E7 E. p8 m4 ~ % U! J: E% I, U% D1 ~1 I2 q比如站点A是加了SSL的,B,C没有加。在site:B.com和site:C.com的结果中,很多内容是来自A的,但是域名是B和C自己的,而且前面加了https ' ^& o$ _! D. Z+ S8 J, Z! D2 T; G / M2 `1 Y, c' `& a这个问题困扰我很久了,一切不知道怎么解决。问了digicert,他们否认是证书引起的。 l: q; e5 {- E. n h, L b/ H
( Z8 q* G O( z6 A一直没搞懂,为什么爬虫在爬B和C时,要去抓取A的内容。$ L' T7 F4 I. I5 m
; Y, i2 _% s; ]/ D' X0 e
大神给的建议吧,多谢 3 l* q) `2 i! _9 I& @8 I + b1 Z% }6 ^% T) Q4 @4 ~$ ^) f+ Q" t