網站(zhàn)地(dì)圖對(duì)網站(zhàn)抓取 ×γ重要(yào)性
雖然在制(zhì)作(zuò)網站(zhàn)的(de)時(shí ∑"λ)候很(hěn)多(duō)要(yào)求是(shì)樹(shùα♣)形結構,但(dàn)由于受到(dào)各種☆↕各樣的(de)限制(zhì),網站(zhàn)并非完δ↑全的(de)樹(shù)型或者網狀型結構。$≈所以,就(jiù)需要(yào)網站(zhàβ±♣÷n)地(dì)圖起到(dào)輔助導航的(de)作(zuò)用(y¥ ↕≈òng):對(duì)于用(yòng)戶,可(kě)γ ¥以對(duì)網站(zhàn)內(nèi)容一(yī)目了(le≥)然;對(duì)于搜索引擎,可(kě)以跟蹤鏈接爬行(xíδ↑ng)到(dào)網站(zhàn)的(de)主要(↑∞yào)部分(fēn):而對(duì)于網站(₽¥zhàn)本身(shēn),則會(huì)€¥↔↑讓網站(zhàn)顯得(de)更加标準化ε<(huà)和(hé)專業(yè)化(huà)。所&☆以,網站(zhàn)地(dì)圖對(du★×♦ì)于一(yī)個(gè)網站(zhàn)來(lái)說(shuō)十∑→分(fēn)有(yǒu)必要(yào)。
一(yī)般網站(zhàn)地(dì)圖分(fēn)為(wèi)兩>•種:HTML版本的(de)網站(zhàn)地(¶'dì)圖;另外(wài)一(yī)種就(jiù)是(s✘♦hì)XML版本的(de)網站(zhàn)地(dì)圖。下(xià)邊一(yī≤"ε)一(yī)進行(xíng)說(shuō)明(m× íng):
第一(yī)、HTML版本網站(zhàn)地(dì±∑)圖:這(zhè)種版本網站(zhàn)地'¥∞(dì)圖英文(wén)名稱就(jiù)是(shì)sitemap,s為(wè♦"i)小(xiǎo)寫,專指HTML版,這(zhè)種版本就(ji♣<☆ù)是(shì)用(yòng)戶可(kě)以通(tōng)過∞☆≠₹網站(zhàn)看(kàn)得(de)到(dào)λ₹并且列出網站(zhàn)上(shàng)所有(yǒu)頁₽®±面鏈接的(de)頁面。對(duì)一(y₩φ∏<ī)些(xiē)使用(yòng)JS或者圖片過多(duō),甚至全站(zh≥×♥àn)FLASH的(de)網站(zhàn),網站(zhàn)•π地(dì)圖顯得(de)尤為(wèi)重要(yào),是(sh€↔→ì)搜索引擎爬行(xíng)的(de)一(yī)個(gè)重要β"$(yào)補充。對(duì)于小(xiǎo)網站(zhàn),HTML版本↕★ ∑的(de)網站(zhàn)地(dì)圖可(kě)&β<以列車(chē)全站(zhàn)的(de)所★↕<有(yǒu)頁面。對(duì)于中型網站≈'γ(zhàn),就(jiù)不(bù)可(kě)∏✔♠能(néng)列出全部頁面,可(kě)以列π÷≥出重點的(de)一(yī)二級分(fēn)類頁面,或者可(kě)以®§把網站(zhàn)地(dì)圖進行(xíng)分(fēn)塊,第₽©一(yī)塊列出一(yī)級目錄,往下(xià)一(yī)塊列出二級目錄,這(÷ε÷♥zhè)樣循環下(xià)去(qù),也(yě)能(né←∑✘ ng)把大(dà)部分(fēn)頁面列出。其實,一(yī)個(gè)具有(yǒδ®®u)良好(hǎo)導航系統和(hé)內(≠εnèi)部鏈接結構的(de)網站(zhàn),就(jiù)不(bù)一•¥€(yī)定需要(yào)列出所有(yǒu)頁面∞δ₹ 鏈接的(de)網站(zhàn)地(dì)圖λ¶¶π,因為(wèi)對(duì)于搜索引擎和(hé)用(yò↔× ★ng)戶而言,兩者的(de)性質有(yǒu)些(xiē)類似。
第二、XML版本網站(zhàn)地(dì)圖:此種版本的(de)網站(z£>¶→hàn)地(dì)圖英文(wén)名為(wèi)Sitemap,但(dàn)S€ ÷通(tōng)常為(wèi)大(dà)寫。XML網站(zλ↑hàn)地(dì)圖在2005年(nián)首先被Goo ↓™&gle提出,随後包括百度在內(nèi)的(de)各個(gè)搜索引擎都(♠$←dōu)相(xiàng)繼支持。XML版本的(de)€∞→≥網站(zhàn)地(dì)圖全部由XML标簽組成,文(wén)件(jiàn≈₽≤)本身(shēn)一(yī)定要(yào)是(shì)utf8§↑←編碼的(de)。XML地(dì)圖就(jiù)是(shì)列出網站₹•>(zhàn)上(shàng)大(dà)部β♦€分(fēn)需要(yào)被收錄的(de)URL,一(yī)般一(yīε©Ω&)行(xíng)一(yī)個(gè)URL,搜索引擎就(jiù)會&↑(huì)順著(zhe)這(zhè)些(xiē)URL去(qù)爬行(x≥→ íng)。另外(wài),XML版本網站(zhàn)地(dì)圖裡(lǐ)邊±₩有(yǒu)些(xiē)标簽是(shì)我們必須要(yào)掌握的(de):p ★"riority,表示URL重要(yào)程度,默認為(wèi)0.5,最重要™λ(yào)為(wèi)1.0;changefreg,★∞表示更新頻(pín)率,一(yī)般情況下(xià)需要(y→↑₽γào)選擇daily,表示每天都(dōu)會(huì)更新網站(zhà>↑♣n);另外(wài),XML網站(zhàn)地(dì)圖最多(duō)能φ↓(néng)列出五萬個(gè)URL,且文(wén)件(jiàn)不(bù'®←)能(néng)超過10MB。假如(rú)超過了(le↔✔<)這(zhè)個(gè)大(dà)小(xiǎo),那(nà)麽可(kě)以使∞€↕±用(yòng)多(duō)個(gè)網站(zhàn)地(dì)圖。
網站(zhàn)地(dì)圖制(zhì)作(zuò)好(hǎo)之後,可(kě↔∑≤≤)以通(tōng)過工(gōng)具直接向搜索引擎提交,大(dà)♠γ "部分(fēn)的(de)搜索引擎都(dōu)支持提交并且也(yě)有(yǒu↔ )專門(mén)的(de)提交入口。另外(wài)也(yě)可(kě)以使用©→(yòng)robots.txt文(wén)件(jiàn)的(de)形式來(♠lái)通(tōng)知(zhī)搜索引擎網站(zhàn)地(dì)圖π'>的(de)位置。需要(yào)注意的(de)是(shì)通(tōng≤★♠Ω)過XML網站(zhàn)地(dì)圖,隻是(shì)通(tōng)知∞(zhī)搜索引擎那(nà)些(xiē)頁面需要(yào)收錄π₽↕,隻是(shì)讓搜索引擎知(zhī)道(dào)這(z®Ω&$hè)些(xiē)頁面的(de)存在,但(dàn)是(¥$ shì)并不(bù)保證一(yī)定會(huì)被收錄,需要(yào)收βλ™錄還(hái)必須達到(dào)最低(dī)收錄标準,所以不(bù)δ π要(yào)以為(wèi)有(yǒu)了(le)網站(zhàn)地(♥ dì)圖的(de)存在而不(bù)顧網站(zhàn)結構以及合理(lǐ)的(↕αde)內(nèi)部鏈接。
最後要(yào)說(shuō)的(de)就(←≤♣jiù)是(shì)網站(zhàn)地(dì)圖對(duì)于大(dà)網站(γ$zhàn)來(lái)說(shuō)特别重要(yào),對←↕(duì)于一(yī)般的(de)中小(x≈≠iǎo)型企業(yè)網站(zhàn)和(hé)個(gè♦"•✘)人(rén)網站(zhàn)也(yě)有(yǒu)一(yī)定的(™↑'de)重要(yào)性,但(dàn)體(tǐ)現(γΩ®xiàn)的(de)不(bù)明(mín σg)顯。所以,大(dà)家(jiā)了(le)解網站(zhàn)地(dì≥&☆)圖之後根據自(zì)己的(de)情況,做(zuò)出适合自¶λ(zì)己網站(zhàn)的(de)網站(zhàn)地(dì→)圖。


