17+年服務經(jīng)驗 · 服務企業(yè)6000+
1對1品牌專家服務 + 出品定稿率高達96% + 客戶服務滿意度99%
All the services you need are here, Get It.
當前位置: 首頁 > 設計知識 > 企業(yè)官網(wǎng)設計 > 新站為什么總是收錄過少
我將wordpress 由博客主題換成CMS主題后,發(fā)現(xiàn)文章收錄數(shù)量明顯增加,并由此得出一個結論:百度不愛搜錄具有博客特征的網(wǎng)頁。由于當時考慮不周到,發(fā)表之后,受廣州網(wǎng)站設計到個別網(wǎng)友批評指正。事實上,博客特征的網(wǎng)頁容易產(chǎn)生重復內容,高度重復才是引起百度不收錄wordpress的真正原因。經(jīng)過深思熟慮,以及對蜘蛛訪問日志的觀察和分析,我對百度收錄wordpress博客異常的原因得出新的結論。
1.安裝SEO插件后,百度不收錄頁面。
很多采用wordpress建站的朋友都接觸過All in One SEO這個插件。這個插件可以讓新手一鍵搞定wordpress的站內優(yōu)化。事實證明,這款插件對google優(yōu)化非常的完美,但百度卻總容易出現(xiàn)不收錄的情況。我曾經(jīng)一度懷疑百度會認為All in One SEO 插件存在優(yōu)化過度的問題,從而導致網(wǎng)站降權,不收錄。實際上,All in One SEO 的網(wǎng)頁并沒有被百度降權,導致百度不收錄的罪魁禍首是它的noindex設置。
noindex標簽的作用是向搜索引擎申明該網(wǎng)頁禁止被搜錄和索引,谷歌蜘蛛爬行到這樣標簽的頁面,會自動丟棄掉該頁并繼續(xù)爬行其他頁面,從而減小文章重復度,利于站內目標文章頁權重的集中。百度蜘蛛遇到noindex標簽的頁面后,同樣會丟棄掉該頁。與谷歌不同的是,百度蜘蛛一般不再爬行該頁面包含的文章鏈接,直接返回上一級目錄。由于包含在該頁中的文章無法被百度蜘蛛爬行到,所以頁目錄之下的文章將不會被索引。
解決辦法:
取消All in One SEO 中 noindex設置。
2.wordpress模板導致的原因。
wordpress之所以流行,與其強大的插件擴展能力和數(shù)量豐富的主題模板密不可分。我曾經(jīng)說過,使用wordpress建站的人,百分之99%都直接采用現(xiàn)成的主題來建站。同樣的模板必然導致網(wǎng)絡中出現(xiàn)大量高度重復網(wǎng)站結構和內容。百度不喜歡重復的內容,這些重復內容當然也包含網(wǎng)站模板的HTML代碼。
SEOer通常會選擇一些使用人數(shù)較少的模板來做SEO博客,同時還會對代碼部分做一些更改,如ID部分名稱,title 描述,CSS名稱等等。這些操作的目的,是使得網(wǎng)頁模板代碼盡量避免與其他網(wǎng)站重復,從而更有利于文章的搜錄。當博客正文內容字數(shù)越少時,模板重復對收錄的影響就會變得越大。
解決辦法:
1).增加文章字數(shù)。
2).選擇非熱門wordpress主題。
3).對現(xiàn)有主題進行修改。
3.wordpress摘要設置不當造成站內文章重復。
百度也好,谷歌也罷,沒有哪一家搜索引擎喜歡重復的文章。當一篇文章出現(xiàn)在同一網(wǎng)站內多個不同的頁面中,搜索引擎將花費更多的處理時間來判斷哪一篇文章才是正文。當搜索引擎從程序上難以無法判斷主次時,會降權收錄文章第一次被索引的頁面,或者直接K掉這些重復的頁面。于是很多wordpress站長在百度里site自己的網(wǎng)址,然后驚訝的發(fā)現(xiàn):出現(xiàn)在結果前面的,竟然全都是日歷頁,歸檔頁或分類目錄,而文章正文內容卻被百度隱藏而作為補充內容而存在,甚至壓根就不被索引。
導致這樣的原因是因為你在錄入文章數(shù)據(jù)的時候,既沒有采用more標簽對文章進行截斷,也沒有手動添加摘要。wordpress默認情況下,會將more標簽之前的內容作為摘要輸出到首頁,標簽目錄,分類目錄,歸檔目錄,日歷目錄下。如果沒有用more標簽進行截斷,也沒有手動輸入摘要,那么文章正文會同時出現(xiàn)在首頁,幾個目錄頁,以及文章頁中。由于首頁比目錄頁權重高,目錄頁比文章頁權重高,百度以為文章頁權重最低,便優(yōu)先舍棄掉了。google的真正從技術上實現(xiàn)了文章的篩選機制,能保文章頁被正常的收錄,而百度這方面的技術尚需進一步完善。
解決辦法:
1).每個文章前一兩段后添加more標簽。
2).手動添加文章摘要,不能與more標簽之前相同。
3).精簡標簽數(shù)量。
4.URL設置不合理,不利于收錄。
在很多SEO教程里,都提出過目錄不宜過深。受到這一思想影響,許多站長就將目錄頁,文章頁都控制在二級目錄以內,以為這樣可以讓網(wǎng)頁更好的被收錄。殊不知,這樣的URL方式其實并不利于SEO。搜索引擎蜘蛛爬行算法不光包含URL深度,同時還包括URL的重復度。當蜘蛛需要爬行一個網(wǎng)站時,首先需要根據(jù)網(wǎng)站的權重算出索引的深度和重復數(shù),當網(wǎng)站權重越高時,蜘蛛爬行的深度就越深,允許的重復數(shù)就越大。蜘蛛在索引某一網(wǎng)站的時候,當深度操過一定層次后就會終止爬行其子目錄。在爬行某個層次鏈接的過程中,URL重復數(shù)度超過一定數(shù)量,就會結束對該層目錄的爬行。
如果你的站內除了根目錄就是2級頁面,文章數(shù)量少時還好,如果文章數(shù)量一多,便會加大搜索引擎引擎服務器的負荷,從而引起蜘蛛反感。
解決辦法:
一般而言,搜索引擎對于新站爬行層次都在三層左右。最佳的目錄設置方案應當是目錄/時段/正文。雖然這樣的分類方式在建站初期收錄處在劣勢,但對網(wǎng)站(尤其是對靠長尾關鍵詞取勝的站點)的長期發(fā)展百利而無一害。我個人認為,這種目錄結構是對搜索引擎最友好的,最容易被收錄的結構。
廣州最專業(yè)的網(wǎng)站建設公司,為你提供最好的營銷方案,幫助你獲得更多的訂單。
全國統(tǒng)一服務電話:4000-882-993
掃一掃關注古柏
GOOBAI AD.
Brand Whole Case Design
4000-882-993
m.yiahsve.cn
微信加好友咨詢
廣州古柏廣告策劃有限公司
地址:廣州市天河區(qū)東圃長盛商務大廈B213-215
Copyright?2004-2020 GOOBAI Inc.All rights reserved
粵公網(wǎng)安備: 44010602001481號
備案號:粵ICP備09222445號
與古柏對話
關注古柏