燈塔SEO > 移動SEO > 手機SEO搜索怎么優化?燈塔SEO外包公司分享移動端SEO關鍵詞優化技術!把握風口才能成功,移動端用戶日趨強大便是風口,掌握手機端移動端SEO優化技術,讓你最大化獲取搜索引擎用戶。
參考資料:百度移動搜索建站優化白皮書
移動手機端用戶數量越來越龐大,針對此情況為網站做手機移動端seo優化很有必要,如何做移動seo,手機端seo怎么實施是網站主關注頻次較高的問題?,F目前,也許參照百度官方手機移動搜索相關文檔也許是效率更高、準確率更高的方式。
我們將百度移動搜索建站優化白皮書搬運至此,希望能給廣大站長、特別是想做手機移動端seo的朋友些許啟迪!

1:本移動端seo優化指南包括網站建設、網站優化、百度搜索資源平臺工具解讀、移動端網站常見問題解讀幾個方面,部分細化seo操作點未涉及,僅供參考(篇幅有限,為展示完整版白皮書,請悉知)。
2:如何建設對搜索引擎友好的網站。
2.1 域名選擇
網站域名選擇,不僅能快速直觀讓用戶了解網站定位,域名設置,更會影響搜索對網站的抓取情況。因此,選擇簡單好記且安全的域名,是網站搭建前期最重要的一步。
2.1.1 域名選擇的注意事項
網站搭建之初,對網站域名選擇,建議域名獨立,簡單好記;獨立移動站域名選擇也遵循此規則。
移動站的域名需與PC站域名分開,移動站不建議與PC站公用一個域名;比如PC網站域名建議是www.sekieigym.com,對應移動站的域名是m.seodt.com,而不是www.sekieigym.com/m/的形式;如果是自適應網站可不考慮此情況。
網站域名選擇中,主要有以下兩點建議:
√ 建議使用比較常見的域名后綴,如.com\.cn\.net等;
√ 如果網站追求個性化使用罕見域名后綴,為了保證搜索效果,請來百度搜索資源平臺(原百度站長平臺)進行站點驗證。
2.1.2 使用子域名或目錄
網站是否需要建立子域名,或是劃分多級目錄,可根據網站自身定位及網站內容量級決定。通常來說,綜合類或內容量較多的網站,可將內容按照不同二級域明確劃分;而如果網站內容較少,不建議網站開設過多的子域名。
舉例來說,blog形式站點,有的網站給到每個blog作者單獨的三級域,但如果作者發布頻率較低,整個三級域都是更新頻率很低的狀態,過低的發布頻率對搜索引擎來說是不友好的。
2.2 內容發布系統
內容發布系統,無論是網站自建還是使用第三方建站系統,百度都是支持的;所有發布系統,除遵循有條理、邏輯清晰建站,還要注意網站搭建的安全問題,避免網站安全隱患,才能更好的提升網站價值。
2.2.1 自建內容發布系統
網站自建內容發布系統,注意事項包括:
√ 主體內容清晰且能夠很好的識別與分辨;
√ 后臺發布時間切勿自行設置,遵循發布時間與展示時間一致;
√ 內容發布系統中各表單設置合理,如對tag標簽的設置不宜過多、不宜羅列關鍵詞;
√ 分類劃分明確,分類主題的文章對應發布到相應分類下;
√ 題文相符,切勿掛羊頭賣狗肉,欺騙搜索引擎流量,損傷用戶體驗;
√ 段落清晰合理、字體大小適中、字體顏色切勿使用與背景色相近的顏色;
√ 發布內容目錄劃分清晰,具體參考2.3章節中網站結構設置。
2.2.2 第三方發布系統
使用第三方發布系統建站,需要站長關注以下注意事項:
√ 模板主題不建議頻繁更換;
√ 類似wordpress等系統,不建議使用過多插件,會影響網頁打開速度;
√ URL偽靜態的處理,命名規范、層級清晰;
√ 開源建站系統存在較多安全隱患,使用過程中務必做一些安全上的設置和優化。
2.2.3 頁面生成規范
無論網站自建發布系統,還是網站使用第三方建站系統,網站頁面的生成,都應注意以下幾點:
√ 網頁結構清晰、各分類名稱設置醒目;
√ 導航、面包屑導航設置合理,機器可讀、位置突出,用戶能很好得知所訪問頁面在網站中的位置;
√ 不存在遮擋主體內容的廣告元素;
√ 無三俗圖文、音頻元素;
注意網站搭建系統安全問題,杜絕網站安全隱患。
訪問請求中的content-type需要根據對應的類型進行正確設置,圖示如下:

除此之外,關于頁面規范標準,建議參考搜索學院發布的《百度搜索Mobile Friendly(移動友好度)標準V1.0》
2.3 網站結構
合理設置網站結構,是網站被快速抓取、獲得搜索流量的基礎;因網站結構設置不合理,導致網站無法被快速識別抓取的事例在百度日常反饋中經常見到,且網站換域名也會對網站造成一定損失,故希望各位站長從建站之初重視網站結構設置,避免不必要的損失。
2.3.1 URL結構設置
URL搭建是否有嚴格要求,請看以下幾點注意事項:
√ 在搭建網站結構、制作URL時,盡量避開非主流設計,追求簡單美即可,越簡單越平常,越好,例如URL中出現生僻字符,如不常見的“II”,會引起搜索引擎識別錯誤;
√ URL長度要求去掉協議頭http(s)://之后的URL長度不要超過256個字節;
√ 謹慎使用#參數,有效的參數不能放在#后面;可能被截斷導致網頁抓取異常。
2.3.2 目錄結構設置
網站目錄結構搭建是否合理,影響搜索引擎對網站的抓取情況,這里需要提到的是,網站目錄結構無論是扁平化還是樹形結構,一般都可以被搜索引擎發現,但有以下幾點注意事項:
√ 建議不同內容放在不同目錄或子域下,域名劃分在2.1.2網站域名劃分章節中有詳細提到;
√ 不要使用孤島鏈接,孤島鏈接很難被搜索引擎快速發現;若網站已存在大量孤島鏈接,建議使用搜索資源平臺的鏈接提交工具向百度提交數據;
√ 重要內容不建議放在深層目錄,若該內容沒有大量內鏈指向,搜索引擎很難判斷該頁面的重要程度。
以下是圖片示例:

2.4 服務商/自建服務器
選擇服務商或者自建服務器,對網站搭建都是十分重要基礎的一環;服務器安全和穩定將直接影響百度搜索引擎對網站的整體判斷。
2.4.1 域名服務
2.4.1.1 域名服務&域名部署
關于域名服務和域名部署,有以下注意事項:
√ 站長在域名部署中請仔細各環節問題,不要出現域名部署錯誤情況;
√ 不建議網站進行泛解析,若網站爆發大規模泛解析,且影響惡劣,則會受到搜索策略打壓;
√ 盡量選擇優質域名服務商。
2.4.2 服務器
做網站還有非常重要的一環,就是服務器的選擇,那服務器選擇中,無論是虛擬主機、云主機還是獨立的服務器,都應該注意以下四點:
√ 中文網站不建議選擇國外服務器;
√ 服務器的穩定性非常重要,需要保持訪問流暢,服務器是否穩定,可以使用百度搜索資源平臺(原百度站長平臺)抓取異常、抓取診斷工具進行檢測維護。(服務器經常無法訪問或者死機,對爬蟲來講都是致命傷害);
√ 服務器選擇除了自身的穩定性外,實際上還要考慮網站的業務量,例如帶寬、內存、CPU是否能夠承受訪問量,突發大流量情況下是否可以正常訪問;
√ 服務器主機設置,需要注意是否有禁止爬蟲抓取的設置、或存在404錯誤信息設置,這些情況都會引起不必要的搜索引擎抓取判斷異常,為網站帶來不必要的損失。
2.4.2.1 虛擬主機
總的來說,建議虛擬主機選購時候需要特別注意:
√ 主機商是否存在限制搜索引擎訪問的情況;
√ 主機商的資質是否符合要求;
√ 主機商的技術沉淀是否足夠,建議選擇品牌較大的主機商;
√ 主機商托管的機房的物理條件和網絡條件是否足夠優秀;
√ 主機商的技術和客服支持情況是否夠好;
√ 主機商是否會存在超容量的情況;
√ 主機商是否存在違規接入高風險站點的問題或同一IP下是否會存在高風險站點的情況;
√ 國內站點建議選購國內云主機建站。
2.4.2.2 獨立主機
獨立主機為站點帶來更加寬松的使用環境和個性軟件的安裝,因此獨立主機需要站長擁有一定的技術力量來保證網站的正常運行和安全。
我們對于站長選購和托管獨立主機的建議是:
√ 注意虛擬主機是否有將爬蟲IP拉入黑名單,關于百度UA,可以參考3.1.2.1百度蜘蛛章節;
√ 建議使用獨立IP地址的主機;
√ 建議使用規模較大機構的主機,在安全配置、穩定性上相對更好;
√ 對IDC服務商的建設標準需要一定的考慮,例如防火、防盜、是否有UPS保證、室內溫控、消防等;
√ IDC服務商的服務質量和技術是否達標,是否24h值班,是否能夠協助排查一些故障、免費重啟重裝系統等;
√ IDC機房的資質是否齊全,存放站點是否有高風險站點或服務器存在。
2.4.3 安全服務
2.4.3.1 HTTPS
當前百度已實行全站化HTTPS安全加密服務,百度HTTPS安全加密已覆蓋主流瀏覽器,旨在用戶打造了一個更隱私化的互聯網空間、加速了國內互聯網的HTTPS化。同時也希望更多網站加入到HTTPS的隊伍中來,為網絡安全貢獻一份力量。
HTTPS安全原理解析
HTTPS主要由有兩部分組成:HTTP + SSL / TLS,也就是在HTTP上又加了一層處理加密信息的模塊。服務端和客戶端的信息傳輸都會通過TLS進行加密,所以傳輸的數據都是加密后的數據。
HTTS復雜的加密機制有效的加大了網站的安全性,加密機制與認證機制可以減少網站被劫持和假冒的風險,建議站長們可以通過做HTTPS改造來強化網站安全。
百度搜索資源平臺為了更好的抓取識別HTTPS網站,2017年還推出了HTTPS認證工具,已經完成HTTPS改造的網站,可以在搜索資源平臺-網站支持-HTTPS認證工具中提交網站的HTTPS數據,便于百度更好抓取識別網站。關于HTTPS認證工具詳解,可以參考5.3.2HTTPS認證工具章節。
2.4.3.2 網站防止被黑對策
網站被黑,通常表現為網站中出現大量非本網站發布的類似博彩內容,或網站頁面直接跳轉到博彩頁面;以下是網站被黑后發布的內容:
內容非網站發布,內容中含大量博彩網站指向:

網站頁面直接跳轉到博彩網站:

網站被黑代表網站安全存在嚴重問題或漏洞,如何防范網站被黑,請參考以下:
首先,自查是否被黑
√被黑網站在數據上有一個特點,即索引量和從搜索引擎帶來的流量在短時間內異常數據異常。所以,站長可以利用百度搜索資源平臺(原百度站長平臺)的索引量工具,觀察站點索引量是否有異常;如果發現數據異常,再通過流量與關鍵詞工具查看獲得流量的關鍵詞是否與網站有關、是否涉及博彩和色情;
√ 通過Site語法查詢站點,結合一些常見的色情、博彩類關鍵詞效果更佳,有可能發現不屬于站點的非法頁面;
√ 由于百度流量巨大,有些被黑行為僅針對百度帶來的流量予以跳轉,站長很難發現,所以在查看自己站點是否被黑時,一定要從百度搜索結果中點擊站點頁面,查看是否跳轉到了其他站點;
√ 站點內容在百度搜索結果中被提示存在風險;
√ 后續可以請網站技術人員通過后臺數據和程序進一步確認網站是否被黑。
其次,被黑之后如何處理
√ 確認網站被黑后,SEO人員除了要推動技術人員快速修正外,還需要做一些善后和預防的工作;
√ 網站如有變更頁面,變更頁面建議使用鏈接提交工具向百度提交數據;
√ 立即停止網站服務,避免用戶繼續受影響,防止繼續影響其他站點;
√ 如果同一主機提供商同期內有多個站點被黑,可以聯系主機提供商,敦促對方做出應對;
√ 清理已發現的被黑內容,將被黑頁面設置為404死鏈,并通過百度搜索資源平臺(原百度站長平臺)死鏈提交工具進行提交。(我們發現有些站點采用了將被黑頁面跳轉至首頁的做法,非常不可取。);
√ 排查出可能的被黑時間,和服務器上的文件修改時間相比對,處理掉黑客上傳、修改過的文件;檢查服務器中的用戶管理設置,確認是否存在異常的變化;更改服務器的用戶訪問密碼。注:可以從訪問日志中,確定可能的被黑時間。不過黑客可能也修改服務器的訪問日志;
√ 做好安全工作,排查網站存在的漏洞,防止再次被黑。
網站自我防護的注意事項:
√ 多種安全防護同步進行:適合中小型資訊網站;
● 網站程序勤打補?。含F在很多資訊類網站用的系統使用了內容管理系統(CMS),作為新聞發布系統,功能還算可以了,但是作為比較常見的內容管理系統(CMS),也有另一個問題,那就是漏洞比較大眾化,因為源碼是公開的,所以很容易被研究出漏洞,需要對網站程序及時進行漏洞修復。
√ 對服務器進行常規的安全防護;
● 在上班時間之外,對服務器上的網站權限做設置,禁止文件修改,后臺文件隱藏或遷移到根目錄之外。
● 參考一些網站的安全設置,非限定的IP不能寫入到數據庫。
√ 不使用開源程序默認的robots文件;
● 下圖是一個地級市的資訊類站點的robots文件,從robots文件中可以看出,該網站用的是織夢后臺,那黑客就可以通過各種針對織夢攻擊的軟件進行操作了,也可以針對織夢網站的常見漏洞進行掃描和針對性攻擊了。

2.4.4 網絡服務
2.4.4.1 CDN
從搜索抓取機制上講:百度蜘蛛對站點的抓取方式和普通用戶訪問一樣,只要普通用戶能訪問到的內容,百度蜘蛛就能抓取到。不管是用什么技術,只要能保證用戶能流暢的訪問網站,對搜索引擎就沒有影響。但有站長反饋使用CDN后出現網站抓取異常、甚至流量異常等問題,主要是兩方面的因素:
一是部分CDN服務商硬件投入不夠,經常出現不穩定情況,會導致大量的蜘蛛抓取失敗,從而影響網站抓取效果,有的甚至影響了索引量數據;所以選擇有實力的CDN服務商很重要;
二是緩存機制在網站出現死鏈、無法打開、被黑等情況的時候起到了推波助瀾的作用。短時間內產生了一些不利快照,影響了排名。這種情況不用擔心,及時清理源文件和CDN緩存,并在百度搜索資源平臺(原百度站長平臺)提交相關死鏈數據等方法進行挽回,是可以恢復的。
3 網站優化
3.1 抓取友好性
關于抓取的優先級,在此重點強調:
√ 網站更新頻率:經常更新高價值的站點,優先抓??;
√ 受歡迎程度:用戶體驗好的站點,優先抓??;
√ 優質入口:優質站點內鏈接,優先抓??;
√ 歷史的抓取效果越好,越優先抓??;
√ 服務器穩定,優先抓??;
√ 安全記錄優質的網站,優先抓??;
順暢穩定的抓取是網站獲得搜索用戶、搜索流量的重要前提,影響抓取的關鍵因素,站長可以通過本章節了解。
3.1.1 URL規范
網站的URL如何設置,可參考2.3.1中的URL設置規范
3.1.1.1 參數
URL中的參數放置,需遵循兩個要點:
√ 參數不能太復雜;
√ 不要用無效參數,無效參數會導致頁面識別問題,頁面內容最終無法在搜索展示
另外,很多站長利用參數(對搜索引擎和頁面內容而言參數無效)統計站點訪問行為,這里強調下,盡量不要出現這種形式資源,例如:
https://www.test.com/deal/w00tb7cyv.html?s=a67b0e875ae58a14e3fcc460422032d3
或者:
http://nmtp.test.com/;NTESnmtpSI=029FF574C4739E1D0A45C9C90D656226.hzayq-nmt07.server.163.org-8010#/app/others/details?editId=&articleId=578543&articleType=0&from=sight
3.1.2 鏈接發現
3.1.2.1 百度蜘蛛
很多站長會咨詢如何判斷百度移動蜘蛛,這里推薦一種方法,只需兩步,正確識別百度蜘蛛:
查看UA
如果UA都不對,可以直接判斷非百度搜索的蜘蛛,目前對外公布過的UA是:
移動UA 1:
Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/ search/ spider.html)
移動UA 2:
Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)
PC UA 1:
Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)
PC UA 2:
Mozilla/5.0(compatible;Baiduspider-render/2.0;+http://www.baidu.com/search/ spider.html)
反查IP
站長可以通過DNS反查IP的方式判斷某只蜘蛛是否來自百度搜索引擎。根據平臺不同驗證方法不同,如Linux/Windows/OS三種平臺下的驗證方法分別如下:
在Linux平臺下,可以使用hostip命令反解IP來判斷是否來自百度蜘蛛的抓取。百度蜘蛛的hostname以*.baidu.com格式命名,非*.baidu.com即為冒充。

這里需要再提出一點,建議使用DNS更換為8.8.8.8后進行nslookup反向解析,否則很容易出現無返回或返回錯誤的問題。
在Windows平臺下,可以使用nslookup ip命令反解IP來判斷是否來自百度蜘蛛的抓取。打開命令處理器輸入nslookup xxx.xxx.xxx.xxx(IP地址)就能解析IP,來判斷是否來自百度蜘蛛的抓取,百度蜘蛛的hostname以*.baidu.com格式命名,非*.baidu.com即為冒充。
在Mac OS平臺下,網站可以使用dig命令反解IP來判斷是否來自百度蜘蛛的抓取。打開命令處理器輸入dig xxx.xxx.xxx.xxx(IP地址)就能解析IP,來判斷是否來自百度蜘蛛的抓取,百度蜘蛛的hostname以*.baidu.com的格式命名,非*.baidu.com即為冒充。
3.1.2.2 鏈接提交
鏈接提交工具是網站主動向百度搜索推送數據的工具,網站使用鏈接提交可縮短爬蟲發現網站鏈接時間,目前鏈接提交工具支持四種方式提交:
√ 主動推送:是最為快速的提交方式,建議將站點當天新產出鏈接立即通過此方式推送給百度,以保證新鏈接可以及時被百度抓??;
√ Sitemap:網站可定期將網站鏈接放到Sitemap中,然后將Sitemap提交給百度。百度會周期性的抓取檢查提交的Sitemap,對其中的鏈接進行處理,但抓取速度慢于主動推送;
√ 手工提交:如果不想通過程序提交,那么可以采用此種方式,手動將鏈接提交給百度;
√ 自動推送:是輕量級鏈接提交組件,將自動推送的JS代碼放置在站點每一個頁面源代碼中,當頁面被訪問時,頁面鏈接會自動推送給百度,有利于新頁面更快被百度發現。
簡單來說:建議有新聞屬性站點,使用主動推送進行數據提交;新驗證平臺站點,或內容無時效性要求站點,可以使用Sitemap將網站全部內容使用Sitemap提交;技術能力弱,或網站內容較少的站點,可使用手工提交方式進行數據提交;最后,還可以使用插件方式,自動推送方式給百度提交數據。
3.1.3 網頁抓取
3.1.3.1 訪問速度
關于移動頁面的訪問速度,百度搜索資源平臺(原百度站長平臺)已于2017年10月推出過閃電算法,針對頁面首頁的打開速度給予策略支持。閃電算法中指出,移動搜索頁面首屏加載時間將影響搜索排名。移動網頁首屏加載時間在2秒之內的,在移動搜索下將獲得提升頁面評價優待,獲得流量傾斜;同時,在移動搜索頁面首屏加載非常慢(3秒及以上)的網頁將會被打壓。
對于頁面訪問速度的提速,這里也給到幾點建議:
資源加載:
√ 將同類型資源在服務器端壓縮合并,減少網絡請求次數和資源體積;
√ 引用通用資源,充分利用瀏覽器緩存;
√ 使用CDN加速,將用戶的請求定向到最合適的緩存服務器上;
√ 非首屏圖片類加載,將網絡帶寬留給首屏請求。
頁面渲染:
√ 將CSS樣式寫在頭部樣式表中,減少由CSS文件網絡請求造成的渲染阻塞;
√ 將JavaScript放到文檔末尾,或使用異步方式加載,避免JS執行阻塞渲染;
√ 對非文字元素(如圖片,視頻)指定寬高,避免瀏覽器重排重繪;
希望廣大站長持續關注頁面加載速度體驗,視網站自身情況,參照建議自行優化頁面,或使用通用的加速解決方案(如MIP),不斷優化頁面首屏加載時間。
了解MIP-移動網頁加速器可參考:https://www.mipengine.org/
3.1.3.2 返回碼
HTTP狀態碼是用以表示網頁服務器HTTP響應狀態的3位數字代碼。各位站長在平時維護網站過程中,可能會在站長工具后臺抓取異常里面或者服務器日志里看到各種各樣的響應狀態碼,有些甚至會影響網站的SEO效果,例如重點強調網頁404設置,百度搜索資源平臺(原百度站長平臺)中部分工具如死鏈提交,需要網站把內容死鏈后進行提交,這里要求設置必須是404。
下面為大家整理了一些常見的HTTP狀態碼:
301:(永久移動)請求的網頁已被永久移動到新位置。服務器返回此響應(作為對GET或HEAD請求的響應)時,會自動將請求者轉到新位置。
302:(臨時移動)服務器目前正從不同位置的網頁響應請求,但請求者應繼續使用原有位置來進行以后的請求。此代碼與響應GET和HEAD請求的301代碼類似,會自動將請求者轉到不同的位置。
這里強調301與302的區別:
301/302的關鍵區別在于:這個資源是否存在/有效;
301指資源還在,只是換了一個位置,返回的是新位置的內容;
302指資源暫時失效,返回的是一個臨時的代替頁(例如鏡像資源、首頁、404頁面)上。注意如果永久失效應當使用404。
有時站長認為百度對302不友好,可能是誤用了302處理仍然有效的資源;
400:(錯誤請求)服務器不理解請求的語法;
403:(已禁止)服務器已經理解請求,但是拒絕執行它;
404:(未找到)服務器找不到請求的網頁;
這里不得不提的一點,很多站長想自定義404頁面,需要做到確保蜘蛛訪問時返回狀態碼為404,若因為404頁面跳轉時設置不當,返回了200狀態碼,則容易被搜索引擎認為網站上出現了大量重復頁面,從而對網站評價造成影響;
500:(服務器內部錯誤)服務器遇到錯誤,無法完成請求;
502:(錯誤網關)服務器作為網關或代理,從上游服務器收到了無效的響應;
503:(服務不可用)目前無法使用服務器(由于超載或進行停機維護)。通常,這只是一種暫時的狀態;
504:(網關超時)服務器作為網關或代理,未及時從上游服務器接收請求。
3.1.3.3 robots
robots工具的詳細工具使用說明,細節參考4.3.4robots工具章節,關于robots的使用,僅強調以下兩點:
√ 百度蜘蛛目前在robots里是不支持中文的,故網站robots文件編寫不建議使用中文字符;
√ robots文件支持UrlEncode編碼這種寫法,如:http://www.test.cn/%E7%89%B9%E6%AE%8A:%E6%B5%8F%E8%A7%88/%E7%94%9F%E6%AD%BB%E7%8B%99%E5%87%BB:%E7%99%BD%E9%93%B6%E5%8A%A0%E7%89%B9%E6%9E%97
3.1.3.4 死鏈
當網站死鏈數據累積過多,并且被展示到搜索結果頁中,對網站本身的訪問體驗和用戶轉化都起到了負面影響。另一方面,百度檢查死鏈的流程也會為網站帶來額外負擔,影響網站其他正常頁面的抓取和索引。
百度搜索資源平臺(原百度站長平臺)推出死鏈提交工具,幫助網站提交死鏈數據,死鏈提交工具使用參考4.3.2死鏈提交工具。
什么是死鏈及死鏈的標準
頁面已經無效,無法對用戶提供任何有價值信息的頁面就是死鏈接,比較常見死鏈形式共有3種,協議死鏈和內容死鏈是比較常見兩種形式,除此之外還有跳轉死鏈。
√ 協議死鏈:頁面的TCP協議狀態/HTTP協議狀態明確表示的死鏈,常見的如404、403、503狀態等;
√ 內容死鏈:服務器返回狀態是正常的,但內容已經變更為不存在、已刪除或需要權限等與原內容無關的信息頁面;
√ 跳轉死鏈:指頁面內容已經失效,跳轉到報錯頁,首頁等行為。
3.1.4 訪問穩定性
訪問穩定性主要有以下幾個注意點:
DNS解析
DNS是域名解析服務器,關于DNS,這里建議中文網站盡可能使用國內大型服務商提供的DNS服務,以保證站點的穩定解析。
分享一個DNS穩定性的示例:
搜索資源平臺(原站長平臺)曾收到多個站長反饋,稱網站從百度網頁搜索消失,site發現網站數據為0。
經追查發現這些網站都使用國外某品牌的DNS服務器 *.DOMAINCONTROL.COM,此系列DNS服務器存在穩定性問題,百度蜘蛛經常解析不到IP,在百度蜘蛛看來,網站是死站點。此前也發現過多起小DNS服務商屏蔽百度蜘蛛解析請求或者國外DNS服務器不穩定的案例。因此這里建議網站,謹慎選擇DNS服務。
蜘蛛封禁
針對爬蟲的封禁會導致爬蟲認為網站不可正常訪問,進而采取對應的措施。爬蟲封禁其實分兩種,一種就是傳統的robots封禁,另一種是需要技術人員配合的IP封禁和UA封禁;而絕大多數情況下的封禁都是一些操作不當導致的誤封禁,然后在搜索引擎上的反應就是爬蟲不能正常訪問。所以針對爬蟲封禁的操作一定要慎重,即使因為訪問壓力問題要臨時封禁,也要盡快做恢復處理。
服務器負載
拋開服務器硬件問題(不可避免),絕大多數引起服務器負載過高的情況是軟件程序引起的,如程序有內存泄露,程序出core,不合理混布服務(其中一個服務消耗服務器資源過大引起服務器負載增大,影響了服務器對爬蟲訪問請求的響應。)對于提供服務的機器一定要注意服務器的負載,留足夠的buffer保證服務器具有一定的抗壓能力。
其他人為因素
人為操作不當引起訪問異常的情況是經常見到的,針對這種情況需要嚴格的制度約束,不同站點情況不一樣。需要保證每一次的升級或者操作要準確無誤。
3.1.5 可訪問鏈接總量
3.1.5.1 資源可窮盡
一般來說網站的內容頁面是可窮盡的,萬級別,百萬級別甚至億級別,但一定是可窮盡的。而現實中確實存在這樣一些網站,爬蟲針對這些網站進行抓取提鏈時會陷入"鏈接黑洞";通俗的講就是網站給爬蟲呈現的鏈接不可窮盡;典型的是部分網站的搜索結果頁,不同的query在不同anchor下的a標簽鏈接不一樣就導致了"鏈接黑洞"的產生,所以嚴禁URL的生成跟用戶的訪問行為或者搜索詞等因素綁定。
3.2 頁面解析
頁面解析,主要指網站頁面被蜘蛛抓取,會對頁面進行分析識別,稱之為頁面解析。頁面解析對網站至關重要,網站內容被抓取是網站被發現的第一步,而頁面解析,則是網站內容被識別出來的重要一環,頁面解析效果直接影響搜索引擎對網站的評價。
3.2.1 頁面元素
3.2.1.1 頁面標題
關于網頁標題,百度搜索于2017年9月推出清風算法,重點打擊網站標題作弊,引導用戶點擊,損害用戶體驗的行為;清風算法重點打擊的標題作弊情況有以下兩種:
√ 文不對題,網站標題與正文有明顯不符合,誤導搜索用戶點擊,對搜索用戶造成傷害;
√ 大量堆砌,網站標題中出現大量堆砌關鍵詞的情況也十分不提倡,
關于網站標題作弊的詳細解讀,參考搜索學院發布官方文檔《百度搜索內容質量白皮書——網頁標題作弊詳解》。
關于網站TDK,有以下幾種情況需要注意:("T"代表頁頭中的title元素,"D"代表頁頭中的description元素,"K"代表頁頭中的keywords元素,簡單指網站的標題、描述和摘要);
√百度未承諾嚴格按照title和description的內容展示標題和摘要,尤其是摘要,會根據用戶檢索的關鍵詞,自動匹配展示合適的摘要內容,讓用戶了解網頁的主要內容,影響用戶的行為決策;
√ 站長會發現同一條鏈接的摘要在不同關鍵詞下是變化的,可能不會完全符合站長預期,尤其是站長在檢索框進行site語法操作時,可能會感覺摘要都比較差。但請不要擔心,畢竟絕大多數普通網民不會這樣操作。在此情況下出現不符合預期的摘要并不代表站點被懲罰;
√ 還有一種情況,是網頁中的HTML代碼有誤,導致百度無法解析出摘要,所以有時大家會看到某些結果的摘要是亂碼(當然這種情況很少見),所以也請站長注意代碼規范。
3.2.1.2 主體內容
主體內容注意兩個點,一個主體內容過長(通常網頁源碼長度不能超過128k),文章過長可能會引起抓取截斷;另外一個是注意內容不能空短,空短內容也會被判斷為無價值內容。
以下分析兩個示例:
關于主體內容過長的示例分析:
某網站主體內容都是JS生成,針對用戶訪問,沒有做優化;但是網站特針對爬蟲抓取做了優化,直接將圖片進行base64編碼推送給百度,然而優化后發現內容沒有被百度展示出來;
頁面質量很好,還特意針對爬蟲做了優化,為什么內容反而無法出現在百度搜索中;
分析主要有以下原因:
√ 網站針對爬蟲爬取做的優化,是直接將圖片base64編碼后放到HTML中,導致頁面長度過長,網站頁面長度達164k;
√ 站點優化后將主體內容放于最后,圖片卻放于前面;
√ 爬蟲抓取內容后,頁面內容過長被截斷,已抓取部分無法識別到主體內容,最終導致頁面被認定為空短而不建索引。
這樣的情況給到以下建議:
√ 如站點針對爬蟲爬取做優化,建議網站源碼長度在128k之內,不要過長;
√ 針對爬蟲爬取做優化,請將主體內容放于前方,避免抓取截斷造成的內容抓取不全。
關于內容空短的示例分析:
某網站反饋網站內容未被建索引,分析發現,網站抓取沒有問題,但被抓取到的頁面,都提示需要輸入驗證碼才能查看全部頁面,這類頁面被判斷為空短頁面,這類頁面在抓取后,會被判定為垃圾內容。
而且當蜘蛛對一個網站抓取后發現大面積都是低值的空短頁面時,爬蟲會認為這個站點的整體價值比較低,那么在后面的抓取流量分布上會降低,導致針對該站點的頁面更新會比較慢,進而抓取甚至建索引庫也會比較慢。

為什么會出現網站內容空短這種情況,其中一個原因是網站內容未全部搭建完成,未對外開放,但已被蜘蛛爬取發現。針對這種情況,建議網站在邀請測試階段使用robots封禁。
另外還會有些網站,設置用戶查看權限,如需用戶登陸才能查看全部內容,這樣的行為對搜索引擎也極不友好,蜘蛛無法模擬用戶登陸,僅能抓取網站已展示頁面,可能會導致抓取頁面為空短的現象。
這里再次強調,不要讓爬蟲給站點畫上不優質的標簽,對網站將產生很不好的影響。另外,移動端的H5頁面,很多都是采用JS方式加載,其實是更容易產生空短,請各位站長注意。
3.2.1.3 網頁發布時間
關于網頁發布時間,有以下幾點建議:
√ 網頁內容盡可能加上產出時間,嚴格說是內容發布時間;且時間盡量全,時間格式為年-月-日 時:分:秒;
例:2017-08-12 10:23:06
√ 網頁上切忌亂加時間,這樣容易造成頁面時間提取問題,或搜索引擎判斷提取時間不可信,從而降低對網頁的展現。
3.2.1.4 canonical標簽
canonical標簽的目的
在PC互聯網時代,canonical標簽的作用主要是用來解決由于網址形式不同內容相同而造成的內容重復問題。而在移動時代,canonical標簽被百度搜索賦予了更多的意義,在原來的作用基礎上,又起到了相同內容的移動頁和PC頁之間的關聯作用;讓移動資源更容易繼承PC資源的各種特征,從而快速生效移動網頁數據。
canonical標簽如何設置
在HTML代碼的head里添加rel="canonical",不能添加多個,否則搜索引擎會認為是無效的canonical標簽。另外需要注意href里的地址不能是死鏈,錯誤頁或者被robots封禁的頁面。
具體示例如下:
<link rel="canonical" href="http://example.test.com/recipe41644.html">
3.2.2 落地頁體驗
為提升移動搜索整體用戶體驗,提升搜索滿意度,百度搜索在2017年推出《百度移動搜索落地頁體驗白皮書——廣告篇2.0》(以下簡稱廣告白皮書)。廣告白皮書對網站移動落地頁頁面廣告內容、廣告位置、大小等做了明確要求,從而充分保證搜索用戶的瀏覽體驗。
白皮書詳情,請參考搜索學院官方文檔《百度移動搜索落地頁體驗白皮書——廣告篇2.0》
3.3 頁面價值
3.3.1 內容價值
原創文章,要求是獨立完成的創作,且沒有歪曲、篡改他人創作或者抄襲、剽竊他人創作而產生的作品,對于改編、注釋、整理他人已有創作而產生的作品要求有充分的點評、補充等增益信息。
建議原創文章在標題下方明確注明“來源:xxxx(本站站點名)”或“本站原創”之類字樣,轉載文章明確注明“來源:xxxx(轉載來源站點名)”之類字樣,不建議使用“admin”、“webmaster”、“佚名”等模糊的說法。
3.3.2 外鏈建設
通常認為,外鏈是本站點對第三方站點頁面的鏈接指向,是本站點對第三方站點頁面內容的一種認可和推薦。
站點進行外鏈建設時,建議是有真實推薦意圖,并且指向那些熟悉的、被認可的、內容相關的外部頁面;不建議推薦與本站點頁面內容無關的外鏈內容。也不建議亂推薦外鏈、交換外鏈互聯、指向作弊站的行為(這些很可能被超鏈策略反向識別成垃圾作弊站點進行打壓)。
最后,站長要及時發現和處理站點被黑的頁面。頁面被黑掉后,一般會被人為放入大量無關的,甚至作弊的外鏈在該頁面上,其目的是要瓜分站點自身權重,并以此來提高外鏈目標站點影響力。建議站長發現后,及時向搜索資源平臺(原站長平臺)提交死鏈進行刪除和屏蔽,不及時處理一定程度上會影響站點本身的權重。最好從技術上優化,提高站點安全壁壘,防范于未然。
3.3.3 內鏈建設
內鏈,描述了站點的結構,一般起到頁面內容組織和站內引導的作用;內鏈的重要意思是通過鏈接指向,告訴搜索引擎哪個頁面最為重要。
內鏈組織的時候,建議結構清晰,不要過于冗雜,另外內鏈組織的版式建議保持一致,這樣對搜索引擎超鏈分析比較友好。
與外鏈類似,建議站長善于使用nofollow標簽,既對搜索引擎友好,又可避免因垃圾link影響到站點本身的權重。
3.3.4 anchor
anchor描述:盡可能使用典型的,有真實意義的anchor。anchor描述要與超鏈接的頁面內容大致相符,避免高頻無意義anchor的使用,另外同一個URL的anchor描述種類不宜過多,anchor分布越稀疏會影響搜索排名。
4 百度專屬SEO工具
4.1 百度搜索資源平臺(原百度站長平臺)介紹
百度搜索資源平臺(原百度站長平臺)是全球最大的面向中文互聯網管理者、移動開發者、創業者的搜索流量管理的官方平臺。提供有助于搜索引擎數據查詢及優化的工具、SEO建議、多端適配服務的能力等。
百度搜索資源平臺域名地址:http://ziyuan.baidu.com/
4.2 查詢工具
4.2.1 索引量工具
網站的索引量指該網站在百度搜索上,可以被用戶搜索到的鏈接總量。百度蜘蛛通過抓取發現網站內容,進行頁面解析,對有價值內容建立索引庫,最終使搜索用戶可以搜索到網站內容。
網站被百度蜘蛛抓取后,經過一系列計算才得以建入索引庫,有了和搜索用戶見面的機會。所以,索引量一直是站長們關注的焦點,但關于索引量工具有一些誤讀,這里給到正確解答:
√ 索引量不等于網站流量:索引庫分多個層級,進入上層索引庫才有更多與搜索用戶見面的機會;進入下層庫機會渺茫。所以,索引量總體的增加減少并不能說明流量會有什么變化;
√ 索引量變化不直接影響流量變化:當流量發生巨大變化時,索引量數據可以作為排查原因的渠道之一,但不是唯一排查渠道,索引量變化并不直接影響流量變化;
√ 索引量浮動情況,索引量上下浮動10%(經驗值),甚至更多,都可能屬于正常。只要流量變化不大就不用緊張。
4.2.2 流量與關鍵詞工具
流量與關鍵詞工具提供站點的熱門關鍵詞在百度搜索結果中的展現及點擊量數據,通過對關鍵詞表現情況的監控,幫助網站更好進行優化,流量與關鍵詞工具可全面幫助站長了解網站在百度搜索引擎中的表現,決定頁面及網站的優化方向,為網站運營決策提供分析依據。
關于流量與關鍵詞工具,還有一點需要強調,如果站長需要在反饋中心中提交關于網站流量異常的情況,請使用此工具的數據、及數據截圖作為證據,便于工作人員分析網站問題。
4.2.3 抓取頻次工具
什么是抓取頻次
抓取頻次是搜索引擎在單位時間內(天級)對網站服務器抓取的總次數,如果搜索引擎對站點的抓取頻次過高,很有可能造成服務器不穩定,百度蜘蛛會根據網站內容更新頻率和服務器壓力等因素自動調整抓取頻次。
什么情況下可以進行抓取頻次上限調整:
首先,百度蜘蛛會根據網站服務器壓力自動進行抓取頻次調整;
其次,如果百度蜘蛛的抓取影響了網站穩定性,站長可以通過此工具調節百度蜘蛛每天抓取網站的頻次上限。
強調1:調整抓取頻次上限不等于調高抓取頻次;
強調2:建議站長慎重調節抓取頻次上限值,如果抓取頻次過小則會影響百度蜘蛛對網站的及時抓取,從而影響索引。
4.2.4 抓取診斷工具
什么是抓取診斷
抓取診斷工具,可以讓站長從百度蜘蛛的視角查看抓取內容,自助診斷百度蜘蛛看到的內容,和預期是否一致。每個站點每周可使用200次,抓取結果只展現百度蜘蛛可見的前200KB內容。
抓取診斷工具能做什么
目前抓取診斷工具有如下作用:
√ 診斷抓取內容是否符合預期,譬如很多商品詳情頁面,價格信息是通過JavaScript輸出的,對百度蜘蛛不友好,價格信息較難在搜索中應用。問題修正后,可用診斷工具再次抓取檢驗;
√ 診斷網頁是否被加了黒鏈、隱藏文本。網站如果被黑,可能被加上隱藏的鏈接,這些鏈可能只在百度抓取時才出現,需要用此抓取工具診斷。
4.2.5 抓取異常工具
什么是抓取異常
百度蜘蛛無法正常抓取,就是抓取異常。通常網站出現抓取異常,都是網站自身原因造成,需要網站根據工具提示,盡快自查網站問題并解決。
抓取異常對網站有哪些影響
對于大量內容無法正常抓取的網站,搜索引擎會認為網站存在用戶體驗上的缺陷,并降低對網站的評價,在抓取、索引、搜索評價上都會受到一定程度的負面影響,最終影響到網站從百度獲取的流量。
抓取異常的原因有哪些
● 網站異常
√ DNS異常:當百度蜘蛛無法解析網站的IP時,會出現DNS異常??赡苁蔷W站IP地址錯誤,或者域名服務商把百度蜘蛛封禁。請使用whois或者host查詢自己網站IP地址是否正確且可解析,如果不正確或無法解析,請與域名注冊商聯系,更新網站IP地址;
√ 連接超時:抓取請求連接超時,可能原因服務器過載,網絡不穩定;
√ 抓取超時:抓取請求連接建立后,下載頁面速度過慢,導致超時,可能原因服務器過載,帶寬不足;
√ 連接錯誤:無法連接或者連接建立后對方服務器拒絕。
● 鏈接異常
√ 訪問被拒絕:爬蟲發起抓取,httpcode返回碼是403;
√ 找不到頁面:爬蟲發起抓取,httpcode返回碼是404;
√ 服務器錯誤:爬蟲發起抓取,httpcode返回碼是5XX;
√ 其他錯誤:爬蟲發起抓取,httpcode返回碼是4XX,不包括403和404。
4.3 提交工具
4.3.1 鏈接提交工具
目前一共有4種提交方式,分別是主動推送、Sitemap、手工提交和自動推送,這四種推送方式的區別,請看下圖:
建議有新聞屬性站點,使用主動推送進行數據提交;新驗證平臺站點,或內容無時效性要求站點,可以使用Sitemap將網站全部內容使用Sitemap提交;技術能力弱,或網站內容較少的站點,可使用手工提交方式進行數據提交;最后,還可以使用插件方式,自動推送方式給百度提交數據。

使用鏈接提交工具,還需要注意的是,部分網站會采用第三方插件推送數據,插件推送方式需要站長仔細檢查推送邏輯,之前發生過站長使用第三方插件推送數據,而第三方插件采用域名+標題進行推送,這樣導致推送給百度的URL中存在中文字符,帶有中文字符的URL會301跳轉到真實的URL上,出現此類情況,是無法享受快速抓取優待的。
鏈接提交工具可以快速幫助站點實現內容抓取,使用第三方插件可以快速幫助站長解決推送的問題,站長只需在選擇插件時,仔細檢查下插件數據邏輯,否則推送錯誤數據,網站數據無法享受快速抓取優待。
4.3.2 死鏈提交工具
為什么要使用死鏈工具
當網站死鏈數據累積過多時,并且被展示到搜索結果頁中,對網站本身的訪問體驗和用戶轉化都起到了負面影響。另一方面,百度檢查死鏈的流程也會為網站帶來額外負擔,影響網站其他正常頁面的抓取和索引。
注意事項:
√ 請推送協議死鏈數據,死鏈工具僅支持協議死鏈數據;
√ 提交死鏈被刪除后,網站可以刪除已提交的死鏈文件,否則搜索仍會繼續抓取死鏈文件,確認文件中內容。
什么是死鏈規則提交?
死鏈規則是鏈接前綴,且匹配前綴的鏈接全部是死鏈。
目前支持兩種死鏈規則:
√ 目錄規則:以“/”結尾的前綴;
√ CGI規則:以“?”結尾的前綴。
什么是死鏈文件提交?
√ 站長需要提交已被百度建索引的、且需要刪除的鏈接,如鏈接在百度搜索不到,則可以不提交死鏈;
√ 需要刪除的鏈接需要全部設置為404,如發現有鏈接非死鏈,會導致文件校驗失敗,從而無法刪除死鏈;
√ 如死鏈文件抓取失敗,可以通過抓取診斷工具判斷死鏈文件是否可以正常抓??;
√ 站長提交死鏈后,請不要在robots中封禁百度蜘蛛,封禁百度蜘蛛會影響鏈接的正常刪除;
√ 如果需要刪除的鏈接已經被刪除,請及時的刪除掉死鏈文件;
√ 提交死鏈工具,最長需要2-3天生效死鏈。如站長發現鏈接未被刪除,一周后可以重新提交。
規則提交:
√ 規則死鏈不支持通配符;
√ 規則死鏈必須是以?或者 /結尾的規則。
- 1703月
【壹起航】網站移動端優化最好的公司
作者 網站移動端優化公? ?·? 發布日期 2020-03-17 ?·? 壹起航今天搜索網站優化這個關鍵詞,發現燈塔seo排名依舊在百度搜索引擎第一位,也同時發現一個有意思的問題:網站移動端優化最好的公司。壹起航認為實際上這個問題是偽命題,沒有標準答案...
- 0803月
【魔貝seo】解讀移動端網站優化新規則
作者 移動端網站優化規? ?·? 發布日期 2020-03-08 ?·? 魔貝seo不止是魔貝seo一直認為,幾乎所有對搜索引擎或者互聯網有認知的人,都會認為移動端網站優化,或者說移動端關鍵詞排名獲取流量是大勢所趨,核心原因在于碎片化的時間較多,而移動設備...
- 0509月
公司網站seo移動端怎么優化
作者 公司移動網站seo? ?·? 發布日期 2019-09-05 ?·? 移動網站seo優化方法以seo顧問多年來接觸企業公司網站來看,現在越來越多的用戶習慣于用手機搜索,結果是公司網站移動端seo的角色越來越重要,針對移動手機端網站優化,是有技術或者說技巧的。針對移動端...
- 3008月
移動端網站SEO優化具體怎么做?
作者 速優網? ?·? 發布日期 2019-08-30 ?·? 怎么做移動端網站SEO優化現在是互聯網時代,更是移動互聯網時代,任何時代把握風口才能順勢而為。移動互聯網時代,手機移動端網站作為多數企業或者個人的產品、服務曝光窗口,其作用更為凸顯,針對移...