駁“目錄的長度(深度)影響SEO優(yōu)化效果”論
在全通公司工作也有兩年了,在這兩年里,有一個(gè)SEO優(yōu)化問題是經(jīng)常被客戶提及:網(wǎng)站后臺(tái)的目錄太深了,足足有四個(gè)文件夾,很不利于SEO優(yōu)化的。面對這個(gè)問題時(shí),小莫通常會(huì)選擇反問他們一句:為什么覺得這會(huì)影響SEO優(yōu)化呢?他們對此的回答多半為:目錄深了,url就會(huì)變得很長,用戶體驗(yàn)也就不好了,甚至?xí)绊懙綑?quán)限和蜘蛛抓取。對此,小莫特意去搜索了相關(guān)的文章,的確也有這種說法的文章。但是,由于小莫從事網(wǎng)站建設(shè)行業(yè)多年,也曾做過搜索引擎相關(guān)的系統(tǒng)開發(fā)工作,對于蜘蛛原理也算是有一點(diǎn)了解。所以,今天就從技術(shù)層面來為大家分析一下,為什么小莫會(huì)覺得這些論調(diào)是錯(cuò)誤的。
在反駁相關(guān)問題之前,我們還是先來了解一下網(wǎng)絡(luò)蜘蛛和網(wǎng)站權(quán)重的基本知識(shí)先吧。
網(wǎng)絡(luò)蜘蛛,別名網(wǎng)絡(luò)爬蟲,是一種按照一定的規(guī)則,自動(dòng)地抓取萬維網(wǎng)信息的程序或者腳本。傳統(tǒng)的爬蟲會(huì)從宇哥或若干初始網(wǎng)頁的url開始,獲得初始網(wǎng)頁的url,在抓取網(wǎng)頁的時(shí)候,會(huì)不斷的從前一個(gè)頁面上抽取新的url放到隊(duì)列之中,直到滿足了系統(tǒng)的一定條件后,再對抓取到的頁面進(jìn)行不同的分析和處理,以提高智能化的搜索結(jié)果排名。如果把整個(gè)互聯(lián)網(wǎng)當(dāng)成一個(gè)網(wǎng)站,那么網(wǎng)絡(luò)蜘蛛就可以用這個(gè)原理把互聯(lián)網(wǎng)上所有的網(wǎng)頁都抓取下來。
由于蜘蛛無法抓取互聯(lián)網(wǎng)上的所有網(wǎng)頁,所以會(huì)對一些不是那么重要的網(wǎng)站設(shè)置訪問層數(shù)。如,在圖1中,A為起始網(wǎng)頁,屬于0層,B、C、D、E、F屬于第1層,G、H屬于第2層,I、J屬于第3層。如果網(wǎng)絡(luò)蜘蛛設(shè)置的訪問層數(shù)為2的話,網(wǎng)頁I、J是不會(huì)被訪問到的。這也讓有些網(wǎng)站上一部分網(wǎng)頁能夠在搜索引擎上搜索到,另外一部分不能被搜索到。但按如圖2中,假如J的層級在A層級中出現(xiàn),則J被視為和A一樣的同一級,也會(huì)被抓取。所以,對于網(wǎng)站設(shè)計(jì)者來說,扁平化的網(wǎng)站結(jié)構(gòu)設(shè)計(jì)有助于搜索引擎抓取其更多的網(wǎng)頁。
圖一
圖二
網(wǎng)絡(luò)蜘蛛進(jìn)入一個(gè)網(wǎng)站時(shí),首先會(huì)去訪問一個(gè)特殊的文本文件,那就是Robots.txt。一般來說,這個(gè)文件會(huì)放在網(wǎng)站服務(wù)器的根目錄下,網(wǎng)站的管理員可以通過Robots.txt來定義那些目錄是網(wǎng)絡(luò)蜘蛛不能爬行的,或者是哪些目錄是哪些搜索引擎蜘蛛無法爬行的。例如有些網(wǎng)站的可執(zhí)行文件目錄和臨時(shí)文件目錄不希望被搜索引擎搜索到,那么網(wǎng)站管理員就可以把這些目錄定義為拒絕訪問目錄。Robots.txt語法很簡單,例如如果對目錄沒有任何限制,可以用以下兩行來描述: User-agent: * Disallow:
當(dāng)然,Robots.txt也只是一個(gè)協(xié)議而已,如果網(wǎng)絡(luò)蜘蛛的設(shè)計(jì)者不想遵守這個(gè)協(xié)議的話,網(wǎng)站管理員是無法阻止網(wǎng)絡(luò)蜘蛛對某些頁面的訪問的。但是,一般來說,網(wǎng)絡(luò)蜘蛛都會(huì)遵守這個(gè)協(xié)議的。其實(shí),我們除了通過Robots.txt來拒接網(wǎng)絡(luò)蜘蛛的爬行之外,我們還可以通過其他方法來拒接網(wǎng)絡(luò)蜘蛛的爬行的。
網(wǎng)絡(luò)蜘蛛在下載網(wǎng)頁的時(shí)候,會(huì)去識(shí)別網(wǎng)頁的HTML代碼,在其代碼的部分,會(huì)有META標(biāo)識(shí)。通過這些標(biāo)識(shí),可以告訴網(wǎng)絡(luò)蜘蛛本網(wǎng)頁是否需要被抓取,還可以告訴網(wǎng)絡(luò)蜘蛛本網(wǎng)頁中的鏈接是否需要被繼續(xù)跟蹤。例如: 表示本網(wǎng)頁不需要被抓取,但是網(wǎng)頁內(nèi)的鏈接需要被跟蹤。
一般的網(wǎng)站都希望搜索引擎能更全面的抓取自己網(wǎng)站的網(wǎng)頁,因?yàn)檫@樣可以讓更多的訪問者能通過搜索引擎找到此網(wǎng)站。為了讓本網(wǎng)站的網(wǎng)頁更全面被抓取到,網(wǎng)站管理員可以建立一個(gè)網(wǎng)站地圖,即Site Map。許多網(wǎng)絡(luò)蜘蛛會(huì)把sitemap.htm文件作為一個(gè)網(wǎng)站網(wǎng)頁爬取的入口,網(wǎng)站管理員可以把網(wǎng)站內(nèi)部所有網(wǎng)頁的鏈接放在這個(gè)文件里面,那么網(wǎng)絡(luò)蜘蛛可以很方便的把整個(gè)網(wǎng)站抓取下來,避免遺漏某些網(wǎng)頁,也會(huì)減小對網(wǎng)站服務(wù)器的負(fù)擔(dān)。
在了解了網(wǎng)絡(luò)蜘蛛的基本原理之外,接下來,我們就一起去了解一下,網(wǎng)站權(quán)重的基本知識(shí)吧。
網(wǎng)站權(quán)重,一般是指:搜索引擎對網(wǎng)站進(jìn)行評估評價(jià)后,給網(wǎng)站賦予的一定的權(quán)威值。一個(gè)網(wǎng)站的權(quán)重越高,那么這個(gè)網(wǎng)站在搜索引擎中所占的分量也就越大,關(guān)鍵詞排名也就越好。雖然說,基本每一個(gè)SEOER都會(huì)討論和研究網(wǎng)站權(quán)重。但是,在某些搜索引擎中,這個(gè)標(biāo)準(zhǔn)是不存在的。概括的說:就是網(wǎng)站與網(wǎng)站在搜索引擎眼中的分級制“待遇”的不同表現(xiàn)。誤區(qū):例如人們經(jīng)常討論的百度權(quán)重其實(shí)并不是百度官方給出的概念,而是一些第三方站長網(wǎng)站推出的針對網(wǎng)站關(guān)鍵詞排名預(yù)計(jì)給網(wǎng)站帶來流量,劃分等級0-10第三方網(wǎng)站歡迎度評估數(shù)據(jù)。影響網(wǎng)站權(quán)重的因素較多,主要有以下幾種:
網(wǎng)站架構(gòu)
網(wǎng)站結(jié)構(gòu)不盡需要迎合搜索引擎的喜好,更要符合用戶體驗(yàn)的要求。而優(yōu)質(zhì)的網(wǎng)站架構(gòu)一般為扁平式,既:主頁>欄目頁>內(nèi)容頁,同時(shí)站點(diǎn)還應(yīng)包含TAG標(biāo)簽,留言評論、文章搜索等。
域名類型
一般來說,gov和edu類型的域名的權(quán)重會(huì)比較高一點(diǎn)。因?yàn)?,用這一類域名的站點(diǎn)基本為政府高校的網(wǎng)站,很少是草根個(gè)人的小站。其實(shí),com、net、org的域名權(quán)重相對較高,一些有國家和地區(qū)特點(diǎn)的域名后綴建議不要選。從用戶習(xí)慣來看,com已成為首選。最后域名的注冊年齡越久,搜索引擎給予的信任越高。
導(dǎo)入鏈接
雖然外鏈的時(shí)代已經(jīng)過去了。但是,外鏈對于網(wǎng)站來說,還是很重要的。只是在今時(shí)今日,我們不僅需要做好外鏈的數(shù)量,更需要做好外鏈的質(zhì)量。只有優(yōu)質(zhì)的外鏈,才能幫助到網(wǎng)站。如果一昧的提高外鏈的數(shù)量,則是很容易受到搜索引擎的懲罰的。
網(wǎng)站內(nèi)容
“外鏈為皇,內(nèi)容為王”這句話充分的表達(dá)出了,內(nèi)容對于網(wǎng)站權(quán)重的重要性。如果能長時(shí)間為網(wǎng)站創(chuàng)造出優(yōu)質(zhì)的原創(chuàng)內(nèi)容的話,網(wǎng)站權(quán)重自然會(huì)蹭蹭往上加的。因?yàn)?,原?chuàng)內(nèi)容就是為搜索引擎注入新鮮的血液。如果,實(shí)在原創(chuàng)不出什么內(nèi)容的時(shí)候,那就偽原創(chuàng)一下。。切忌原封不動(dòng)的復(fù)制粘貼,尤其是機(jī)器采集后進(jìn)行所謂的自動(dòng)偽原創(chuàng),更有甚者前后兩段抄堆疊關(guān)鍵詞或者所謂的偽原創(chuàng),其實(shí)段落語句不通,用戶體驗(yàn)差,網(wǎng)站跳出率高,同樣也不會(huì)有好的權(quán)重。
收錄數(shù)量
堅(jiān)持更新站點(diǎn),合理布置鏈接誘餌,增加站點(diǎn)頁面的收錄數(shù)量。雖說收錄數(shù)量與權(quán)重之間不是絕對關(guān)系,但你見過同類型同行業(yè)的網(wǎng)站收錄數(shù)量僅有幾十的權(quán)重高于幾萬的情況嗎?
關(guān)鍵詞排名
尤其是核心關(guān)鍵詞的排名。首先要明白搜索引擎為什么會(huì)給你的關(guān)鍵詞一個(gè)較高的排名,因?yàn)闄?quán)重高了。其次,認(rèn)真做好相關(guān)關(guān)鍵詞和長尾關(guān)鍵詞的排名,這有利于提升網(wǎng)站的整體權(quán)重。
更新頻率
堅(jiān)持有規(guī)律的更新網(wǎng)站,除了會(huì)獲得及時(shí)的網(wǎng)頁快照外,還能增加搜索引擎的信任度,一個(gè)更新頻繁的網(wǎng)站比那些僵尸網(wǎng)站的權(quán)重肯定會(huì)高很多。同時(shí),應(yīng)注意更新時(shí)間和更新數(shù)量,避免之前積累的權(quán)重慢慢流失了。
內(nèi)容頁
內(nèi)頁是否和首頁以及網(wǎng)站主題有較為緊密的聯(lián)系,內(nèi)頁之間的銜接、關(guān)鍵字的布局,以及內(nèi)頁是否具有專業(yè)性,權(quán)威度如何。
網(wǎng)站的誠信度
Google除PR值以外,還有一個(gè)誠信指數(shù)。即通過對一些高質(zhì)量網(wǎng)站的分析,給出一個(gè)“誠信”網(wǎng)站應(yīng)該有的一些指標(biāo),并用這些指標(biāo)來分析一個(gè)網(wǎng)站的誠信度。
網(wǎng)站服務(wù)器
服務(wù)器穩(wěn)定是關(guān)鍵,如果說搜索引擎抓取頁面時(shí)網(wǎng)站空間無法訪問,特別是新站,網(wǎng)站服務(wù)器不穩(wěn)定可能導(dǎo)致搜索引擎不收錄網(wǎng)站。其次是網(wǎng)站頁面的打開速度,這些服務(wù)器因素對權(quán)重都有影響。
最后聲明下,權(quán)重跟排名不能劃為等號;就像PR≠排名,當(dāng)然這只是SEO細(xì)節(jié)中的一個(gè)重要組成部分。權(quán)重的高低是影響關(guān)鍵詞排名其中的一項(xiàng)重要因素而已。
說完了網(wǎng)絡(luò)蜘蛛和網(wǎng)站權(quán)重的基本原理之后,下面我們就用這些原理來闡述一下,域名路徑的長短是否會(huì)影響到SEO優(yōu)化的效果呢?
首先,我們先去了解一下靜態(tài)路徑的規(guī)則:
靜態(tài)路徑的規(guī)則為:域名/靜態(tài)總目錄/語言目錄/主分類/子分類/內(nèi)容名.html,其實(shí)靜態(tài)總目錄是可以去掉或者修改的。如果為單語言的情況下面,語言目錄也是可以去掉的,但如果為多語言,則此目錄必須保留,以避免相同語言相同目錄及內(nèi)容的覆蓋。
在上面介紹中,我們說過網(wǎng)絡(luò)蜘蛛抓取,是根據(jù)頁面訪問層級來進(jìn)行抓取的,而不是目錄層級,如下圖所示:
假如現(xiàn)在內(nèi)容J中有URL為:http://shshanhu.cn/news/xingyeba/10519.html,如果此內(nèi)容的鏈接出現(xiàn)在J和出現(xiàn)在A層,那么可以分別理解為0層和3層,這種意義是不一樣。如果出現(xiàn)在A層中,那么網(wǎng)絡(luò)蜘蛛在第一次抓取中就比較容易尋獲取此URL,并進(jìn)行抓取保存,而如果出現(xiàn)在J層中,那么當(dāng)網(wǎng)絡(luò)蜘蛛只設(shè)定了二層后,就抓取不到了。這種層級關(guān)系的理解,不是域名文件夾的層級關(guān)系,而是瀏覽深度指向的層級。
所以說,網(wǎng)站后臺(tái)生成的靜態(tài)URL文件夾的多與少,其實(shí)對SEO優(yōu)化效果來說,基本是沒有影響的。但是,如果你的網(wǎng)站是英文網(wǎng)站的會(huì)啊,那么請注意了文件夾的生成文件名,是有一定的影響的。比如產(chǎn)品文件夾的名稱設(shè)定成products和設(shè)定成cb,那是有很大的關(guān)系的,所以切記一條:文件夾盡量取英文名或者英文代表關(guān)鍵字。
那有人又會(huì)說了:既然您網(wǎng)絡(luò)蜘蛛沒有影響,那權(quán)重呢?總會(huì)有一定的影響吧?先前說過了,網(wǎng)頁權(quán)重影響主要是內(nèi)容質(zhì)量、關(guān)鍵字、域名、點(diǎn)擊數(shù)量、收錄數(shù)量、服務(wù)器速度等因素,URL的長短實(shí)際很少,如果不信,您要中以搜索一下百度或者谷歌,他們收錄中,同樣有非常長的URL網(wǎng)頁。
談了這么多原理性之后,不知您還是否跟其它SEOER一樣,同樣認(rèn)為URL長度影響質(zhì)量呢?如果您還堅(jiān)持您的觀點(diǎn),可以多了解一下搜索技術(shù)方面的文章,而不是SEO營銷方面的文章,SEOER更不該誤人子弟,正確理解SEO的重要性,還是對您網(wǎng)站內(nèi)容的質(zhì)量、內(nèi)鏈著手吧!
百度口碑
100%好評
360安全認(rèn)證
安全可信賴
公安機(jī)關(guān)
公網(wǎng)備案