百度對HTTPS站點全流程描述介紹
下面是青島優化公司總結百度對HTTPS站點全流程支持方案文字描述:
HTTPS優勢
HTTPS是基于tls和ssl加密的http協議,網絡傳輸是加密的,因此它的安全是顯而易見的,包括防竊聽、篡改、劫持。
HTTPS的收錄機制
1、Spider如何發現HTTPS
1)、根據網頁中的超鏈接是否是HTTPS,網絡中會有一些超鏈,如果是HTTPS會認為是HTTPS站點。
2)、根據站長平臺提交入口的提交方式,例如主動提交,如果在文件當中提交的是HTTPS鏈接會以HTTPS的形式來發現。
3)、參考前鏈的抓取相對路徑,第一個網頁是HTTPS的,網站內容里面的路徑提供的是相對路徑,會認為這種鏈接是HTTPS。
4)、參考鏈接的歷史狀況,使用這種方式的原因主要是為了糾錯,如果錯誤提取HTTPS會遇到兩種情況,一種因為HTTPS不可訪問會抓取失敗,第二即使能抓成功可能展現出來的可能不是站長希望的,所以會有一定的糾錯。
2、HTTPS鏈接的抓取
現在比較常見的兩種,第一種是純HTTPS抓取,就是它沒有http的版本,第二個是通過http重定向到HTTPS,這兩種都能正常的進行抓取跟http抓取的效果是一樣的。
3、HTTPS的展現
對于HTTPS數據,展現端會有明顯的提示
站長平臺支持全站HTTPS配置
1、HTTPS配置
之前有一些站長改HTTPS,會疑問為什么站點有些鏈接是以http的形式來抓呢?為什么沒有全站都是以HTTPS的形式來抓取呢?因為以前的機制是url級的,HTTPS抓完一條替換一條,整站需要全抓完才能全部替換掉,現在大家訪問站長平臺可以發現,左邊工具欄多了HTTPS認證的功能,站長平臺已經全站支持HTTPS,點這個功能后會有提示引導我們去怎么做,需要提醒是需要全站支持HTTPS,才進行點擊,如果不支持的話對站點會有一些副作用。
2、HTTPS驗證
當站長在平臺上做了配置以后首先會有HTTPS驗證,驗證確認站長是否誤配,具體會檢查https鏈接是不是可抓取的。另外會對HTTPS的證書校驗,包括它的合法性、是否過期、跟它本身的域名是否一致,從這三個角度做校驗。
3、HTTPS生效
校驗通過后,生效方式從這三個角度進行
1)、全站抓取以HTTPS的方式來抓,這會在抓取上做一定的切換2)、全站的展現樣式也會直接切換成HTTPS,用了這個功能的好處是會比以前快很多,會略過已收錄的網頁直接到HTTPS。
常見問題:
1、站長升級HTTPS是不是會影響爬蟲抓???不會。爬蟲對https的合法鏈接都能抓2、站長升級HTTPS是不是會影響索引量?不會的,建庫做了相應升級,HTTPS的建庫是不會有延遲的。
3、站長升級HTTPS是不是會影響排名點擊流量?不會,HTTPS改造是不涉及到域名切換,或者說老域名到新域名樣式的轉變等等這個是不涉及的,可以做到完全無損的切換。
4、站長升級的HTTPS是不是會影響移動適配?不會有這種情況。
5、站長升級HTTPS是不是會影響站長平臺工具?不會,站長平臺鏈接提交等工具已經都支持HTTPS了。
站點建議
1、建議站長從http到HTTPS的301跳轉,不建議只有HTTPS,而無http到HTTPS的跳轉關系,只用HTTPS訪問對用戶來說,可能會遇到問題。
2、不建議HTTPS、http這兩種版本并存,這種情況存在三種問題,第一個它的維護成本比較高,需要維護兩個版本;第二個做不到絕對安全,http訪問有不安全風險;第三有不一致的可能性,隨著長遠的發展這兩個版本可能會越來越不一致,會影響用戶體驗,我們建議站長做了HTTPS之后能對HTTPS做一定的跳轉預設。
3、HTTPS回退到HTTP極不建議。例如線上已經展示HTTPS的鏈接給用戶點擊,如果站長回退到http,用戶在瀏覽器里面點開的時候會展現死鏈的樣式是非常不建議的,做這個之前一定考慮。如果實在想做回退,請在站長平臺提交HTTPS校驗,并建議站點提前至少24小時在平臺提交回退,這樣能夠保證站長的點擊不會出現死鏈的形式,這點非常重要。
4、HTTPS網頁沒有建設完成之前不要在互聯網上提供超鏈接,之前遇到過好幾個case,本身HTTPS并沒有做完,兩個版本都存在,但是http是用戶可訪問的,或者說HTTPS的頁面是一個臨時性的假頁面,這樣站點有可能就以HTTPS的形式展現出來,會引起用戶體驗問題。