駁“全通網(wǎng)站靜態(tài)目錄的長度(深度)對SEO的影響”論
在長時間服務營銷型網(wǎng)站用戶的過程中,經(jīng)常有部分用戶向我抱怨:全通網(wǎng)絡營銷型網(wǎng)站系統(tǒng)的目錄有四個文件夾,目錄太深,會不會影響SEO。我也有時候問他們:為什么會認為有影響?他們對此的回答多為:太長了用戶體驗性不好、會影響權(quán)限、其次是影響蜘蛛抓取,對此論調(diào),我也會搜索網(wǎng)站相關文章,也不乏有些類似的文章做依據(jù),(注:全通網(wǎng)絡營銷型網(wǎng)站系統(tǒng)的最長目錄樣式為:http://shshanhu.cn/html/cn/news/gongsixinwen/18.html),但介于本人從事多年的軟件開發(fā),也從事過搜索引擎相關的系統(tǒng)開發(fā)工作,對蜘蛛原理也算了解,本文階于通過技術層面來分析:為什么這些論調(diào)是錯誤的。
在反駁相關問題之前,我們先來了解一下網(wǎng)絡蜘蛛及網(wǎng)站權(quán)重的基本知識。
一、網(wǎng)絡蜘蛛
網(wǎng)絡蜘蛛又稱網(wǎng)絡爬蟲,傳統(tǒng)的爬蟲從一個或若干初始網(wǎng)頁的URL開始,獲得初始網(wǎng)頁上的URL,在抓取網(wǎng)頁的過程中,不斷從當前頁面上抽取新的URL放入隊列,直到滿足系統(tǒng)的一定停止條件,而后來對抓取頁面進行不同的分析和處理,以提高智能化的搜索結(jié)果排名。如果把整個互聯(lián)網(wǎng)當成一個網(wǎng)站,那么網(wǎng)絡蜘蛛就可以用這個原理把互聯(lián)網(wǎng)上所有的網(wǎng)頁都抓取下來。
由于不可能抓取所有的網(wǎng)頁,有些網(wǎng)絡蜘蛛對一些不太重要的網(wǎng)站,設置了訪問的層數(shù)。例如,在圖1中,A為起始網(wǎng)頁,屬于0層,B、C、D、E、F屬于第1層,G、H屬于第2層,I、J屬于第3層。如果網(wǎng)絡蜘蛛設置的訪問層數(shù)為2的話,網(wǎng)頁I、J是不會被訪問到的。這也讓有些網(wǎng)站上一部分網(wǎng)頁能夠在搜索引擎上搜索到,另外一部分不能被搜索到。但按如圖2中,假如J的層級在A層級中出現(xiàn),則J被視為和A一樣的同一級,也會被抓取。所以,對于網(wǎng)站設計者來說,扁平化的網(wǎng)站結(jié)構(gòu)設計有助于搜索引擎抓取其更多的網(wǎng)頁。
圖1
圖2
網(wǎng)絡蜘蛛進入一個網(wǎng)站,一般會訪問一個特殊的文本文件Robots.txt,這個文件一般放在網(wǎng)站服務器的根目錄下,網(wǎng)站管理員可以通過robots.txt來定義哪些目錄網(wǎng)絡蜘蛛不能訪問,或者哪些目錄對于某些特定的網(wǎng)絡蜘蛛不能訪問。例如有些網(wǎng)站的可執(zhí)行文件目錄和臨時文件目錄不希望被搜索引擎搜索到,那么網(wǎng)站管理員就可以把這些目錄定義為拒絕訪問目錄。Robots.txt語法很簡單,例如如果對目錄沒有任何限制,可以用以下兩行來描述: User-agent: * Disallow:
當然,Robots.txt只是一個協(xié)議,如果網(wǎng)絡蜘蛛的設計者不遵循這個協(xié)議,網(wǎng)站管理員也無法阻止網(wǎng)絡蜘蛛對于某些頁面的訪問,但一般的網(wǎng)絡蜘蛛都會遵循這些協(xié)議,而且網(wǎng)站管理員還可以通過其它方式來拒絕網(wǎng)絡蜘蛛對某些網(wǎng)頁的抓取。
網(wǎng)絡蜘蛛在下載網(wǎng)頁的時候,會去識別網(wǎng)頁的HTML代碼,在其代碼的部分,會有META標識。通過這些標識,可以告訴網(wǎng)絡蜘蛛本網(wǎng)頁是否需要被抓取,還可以告訴網(wǎng)絡蜘蛛本網(wǎng)頁中的鏈接是否需要被繼續(xù)跟蹤。例如: 表示本網(wǎng)頁不需要被抓取,但是網(wǎng)頁內(nèi)的鏈接需要被跟蹤。
一般的網(wǎng)站都希望搜索引擎能更全面的抓取自己網(wǎng)站的網(wǎng)頁,因為這樣可以讓更多的訪問者能通過搜索引擎找到此網(wǎng)站。為了讓本網(wǎng)站的網(wǎng)頁更全面被抓取到,網(wǎng)站管理員可以建立一個網(wǎng)站地圖,即Site Map。許多網(wǎng)絡蜘蛛會把sitemap.htm文件作為一個網(wǎng)站網(wǎng)頁爬取的入口,網(wǎng)站管理員可以把網(wǎng)站內(nèi)部所有網(wǎng)頁的鏈接放在這個文件里面,那么網(wǎng)絡蜘蛛可以很方便的把整個網(wǎng)站抓取下來,避免遺漏某些網(wǎng)頁,也會減小對網(wǎng)站服務器的負擔。
二、企業(yè)網(wǎng)站權(quán)重
在了解了網(wǎng)絡蜘蛛原基本原理之后,我們現(xiàn)在了解一下網(wǎng)站權(quán)重的基本知識,網(wǎng)站權(quán)重是指:搜索引擎給網(wǎng)站賦予一定的權(quán)威值,對網(wǎng)站權(quán)威的評估評價,一個網(wǎng)站權(quán)重越高,在搜索引擎所占的份量越大,在搜索引擎排名就越好。網(wǎng)站權(quán)重雖然很多SEOER都在議論,不過可能這個標準在部分搜索引擎中根本就不存在,概括的說:就是網(wǎng)站與網(wǎng)站在搜索引擎眼中的分級制“待遇”的不同表現(xiàn)。誤區(qū):例如人們經(jīng)常討論的百度權(quán)重其實并不是百度官方給出的概念,而是一些第三方站長網(wǎng)站推出的針對網(wǎng)站關鍵詞排名預計給網(wǎng)站帶來流量,劃分等級0-10第三方網(wǎng)站歡迎度評估數(shù)據(jù)。影響網(wǎng)站權(quán)重的因素較多,主要有以下幾種:
網(wǎng)站架構(gòu)
網(wǎng)站架構(gòu)不僅要迎合搜索引擎,更要符合用戶體驗的要求。優(yōu)質(zhì)的網(wǎng)站架構(gòu)應是扁平式,即:主頁>欄目頁>內(nèi)容頁,同時站點還應包含TAG標簽,留言評論、文章搜索等。
域名類型
一般而言,gov和edu類型的域名權(quán)重自身就比較高,因為這樣的站點屬于政府高校一般不會成為垃圾站點,不會是草根個人小站。其次,com、net、org的域名權(quán)重相對較高,一些有國家和地區(qū)特點的域名后綴建議不要選。從用戶習慣來看,com已成為首選。最后域名的注冊年齡越久,搜索引擎給予的信任越高。
導入鏈接
所謂的導入鏈接即外鏈。外鏈的質(zhì)量和數(shù)量應認真做好。通常,我們要堅持每天穩(wěn)定的增加外鏈,在數(shù)量和質(zhì)量上,優(yōu)先考慮質(zhì)量。所以平時我們應注意多收集一些能做外鏈的優(yōu)質(zhì)博客、論壇,以備不時之需。
網(wǎng)站內(nèi)容
雖說“天下文章一大抄,看你會抄不會抄”,但我們?nèi)越ㄗh站長能練就一副好筆桿。若能堅持給網(wǎng)站創(chuàng)造出優(yōu)質(zhì)的原創(chuàng)內(nèi)容,事實上就是給搜索引擎注入了新鮮的血液。實在是不能原創(chuàng)的時候,一定要偽原創(chuàng)下。切忌原封不動的復制粘貼,尤其是機器采集后進行所謂的自動偽原創(chuàng),更有甚者前后兩段抄堆疊關鍵詞或者所謂的偽原創(chuàng),其實段落語句不通,用戶體驗差,網(wǎng)站跳出率高,同樣也不會有好的權(quán)重。
收錄數(shù)量
堅持更新站點,合理布置鏈接誘餌,增加站點頁面的收錄數(shù)量。雖說收錄數(shù)量與權(quán)重之間不是絕對關系,但你見過同類型同行業(yè)的網(wǎng)站收錄數(shù)量僅有幾十的權(quán)重高于幾萬的情況嗎?
關鍵詞排名
尤其是核心關鍵詞的排名。首先要明白搜索引擎為什么會給你的關鍵詞一個較高的排名,因為權(quán)重高了。其次,認真做好相關關鍵詞和長尾關鍵詞的排名,這有利于提升網(wǎng)站的整體權(quán)重。
更新頻率
堅持有規(guī)律的更新網(wǎng)站,除了會獲得及時的網(wǎng)頁快照外,還能增加搜索引擎的信任度,一個更新頻繁的網(wǎng)站比那些僵尸網(wǎng)站的權(quán)重肯定會高很多。同時,應注意更新時間和更新數(shù)量,避免之前積累的權(quán)重慢慢流失了。
內(nèi)容頁
內(nèi)頁是否和首頁以及網(wǎng)站主題有較為緊密的聯(lián)系,內(nèi)頁之間的銜接、關鍵字的布局,以及內(nèi)頁是否具有專業(yè)性,權(quán)威度如何。
網(wǎng)站的誠信度
Google除PR值以外,還有一個誠信指數(shù)。即通過對一些高質(zhì)量網(wǎng)站的分析,給出一個“誠信”網(wǎng)站應該有的一些指標,并用這些指標來分析一個網(wǎng)站的誠信度。
網(wǎng)站服務器
服務器穩(wěn)定是關鍵,如果說搜索引擎抓取頁面時網(wǎng)站空間無法訪問,特別是新站,網(wǎng)站服務器不穩(wěn)定可能導致搜索引擎不收錄網(wǎng)站。其次是網(wǎng)站頁面的打開速度,這些服務器因素對權(quán)重都有影響。
最后聲明下,權(quán)重跟排名不能劃為等號;就像PR≠排名,當然這只是SEO細節(jié)中的一個重要組成部分。權(quán)重的高低是影響關鍵詞排名其中的一項重要因素而已。
三、全通網(wǎng)絡營銷型網(wǎng)站系統(tǒng)的路徑原理及影響
談了這么多關于搜索技術的基本原理,現(xiàn)在我們根據(jù)這些原理來闡述一下,全通網(wǎng)絡營銷型網(wǎng)站系統(tǒng)域名路徑長短到底是否有影響,首先我們先了解一下全通網(wǎng)絡營銷型網(wǎng)站系統(tǒng)的靜態(tài)路徑規(guī)則:
全通網(wǎng)絡營銷型網(wǎng)站系統(tǒng)的路徑規(guī)則為的:域名/靜態(tài)總目錄/語言目錄/主分類/子分類/內(nèi)容名.html,其實靜態(tài)總目錄是可以去掉或者修改的。如果為單語言的情況下面,語言目錄也是可以去掉的,但如果為多語言,則此目錄必須保留,以避免相同語言相同目錄及內(nèi)容的覆蓋。
在上面介紹中,我們說過網(wǎng)絡蜘蛛抓取,是根據(jù)頁面訪問層級來進行抓取的,而不是目錄層級,下圖3所示:
圖3
假如現(xiàn)在內(nèi)容J中有URL為:http://shshanhu.cn/html/cn/templates/current/418.html,如果此內(nèi)容的鏈接出現(xiàn)在J和出現(xiàn)在A層,那么可以分別理解為0層和3 層,這種意義是不一樣。如果出現(xiàn)在A層中,那么網(wǎng)絡蜘蛛在第一次抓取中就比較容易尋獲取此URL,并進行抓取保存,而如果出現(xiàn)在J層中,那么當網(wǎng)絡蜘蛛只設定了二層后,就抓取不到了。這種層級關系的理解,不是域名文件夾的層級關系,而是瀏覽深度指向的層級。
所以全通網(wǎng)絡營銷型網(wǎng)站系統(tǒng)生成靜態(tài)URL文件夾的多少,實際對SEO是沒有影響的,但如果您的網(wǎng)站是英文網(wǎng)站,請注意,文件夾的生成文件名,是有一定的影響的。比如產(chǎn)品文件夾的名稱設定成products和設定成cb,那是有很大的關系的,所以切記一條:文件夾盡量取英文名或者英文代表關鍵字。
那有人又會說了:既然您網(wǎng)絡蜘蛛沒有影響,那權(quán)重呢?總會有一定的影響吧?先前說過了,網(wǎng)頁權(quán)重影響主要是內(nèi)容質(zhì)量、關鍵字、域名、點擊數(shù)量、收錄數(shù)量、服務器速度等因素,URL的長短實際很少,如果不信,您要中以搜索一下百度或者谷歌,他們收錄中,同樣有非常長的URL網(wǎng)頁。
談了這么多原理性之后,不知您還是否跟其它SEOER一樣,同樣認為URL長度影響質(zhì)量呢?如果您還堅持您的觀點,可以多了解一下搜索技術方面的文章,而不是SEO營銷方面的文章,SEOER更不該誤人子弟,正確理解SEO的重要性,還是對您網(wǎng)站內(nèi)容的質(zhì)量、內(nèi)鏈著手吧!