前面我們眾騰網(wǎng)絡分享了《搜索引擎工作原理之預處理和索引與鏈接關系的計算》,當搜索引擎蜘蛛爬行和抓取網(wǎng)頁之后,會對得到的網(wǎng)頁進行一系列的預處理,最后得到關于網(wǎng)頁的反向索引集合,這時搜索引擎就可以根據(jù)用戶輸入的搜索詞對網(wǎng)頁做出排名了。
當然,從用戶輸入搜索詞到搜索引擎展示出相關的網(wǎng)頁排名結(jié)果,中間還要經(jīng)過相當復雜的計算過程!
搜索引擎會對用戶輸入的搜索詞進行分詞處理和去噪,如果對分詞處理和去噪還不是很了解的小伙伴,大家可以到《參考搜索引擎工作原理:預處理這篇文章》,這里就不多做介紹了,當搜索引擎分詞和去噪完畢之后,會得到幾個關鍵詞,然后按照這幾個關鍵詞的邏輯“與”關系到反向索引集合中去進行匹配,比如網(wǎng)友輸入“桂林網(wǎng)站建設”最后會被搜索引擎分詞成“桂林”,“網(wǎng)站”,“建設”這三個關鍵詞,然后再去爬行和抓取的網(wǎng)頁反向索引庫中查找同時包含這三個關鍵詞的頁面,因為這樣得到的網(wǎng)頁相關性更高。
當搜索引擎得到這些網(wǎng)頁之后會發(fā)現(xiàn),這些網(wǎng)頁的數(shù)量是相當龐大的,而用于展示在用戶面前的搜索結(jié)果頁面不超過1000個,百度也只展示了760個頁面,所以搜索引擎會對這些頁面進行相關性之外的計算,其中影響較大的一個因素就是網(wǎng)頁的權(quán)重,根據(jù)網(wǎng)頁權(quán)重的高低排序會篩選出一批頁面,至于篩選出多少頁面,這里不得而知,但肯定大于1000個頁面。
在選出這些權(quán)重較高相關性較強的頁面之后,接下來搜索引擎會對這些頁面進行更加細微的相關性計算,這個過程也是我們seoer更為關心的一個過程,因為這個過程中的很多因素是我們這些seoer可以控制的。
關鍵詞的常見指數(shù),比如用戶搜索“桂林旅游”,經(jīng)過搜索引擎分詞可以分成“桂林”,“旅游”,我們可以很明顯的看出“旅游”這個詞在我們生活中經(jīng)常會出現(xiàn),而“桂林”就出現(xiàn)的比較少了,針對都包含“桂林”和“旅游”關鍵詞的兩個頁面,顯然在標題中出現(xiàn)關鍵詞“桂林”比內(nèi)容中出現(xiàn)“桂林”的相關性更強。
關鍵詞的頻率及密度,這個比較好理解,如果關鍵詞在頁面中的出現(xiàn)的頻率很高,密度也很大(這里不考慮關鍵詞的堆砌),那么這個頁面和這個關鍵詞的相關性很強。
關鍵詞的位置和表現(xiàn)形式,就像在上面說的搜索引擎工作原理:索引與鏈接關系的計算這篇文章中提到的,關鍵詞的位置和表現(xiàn)形式都會被列入相關性計算中,比如一些標題標簽的使用,文字加粗和顏色變化,H1標簽等。
關鍵詞是否完整匹配,如果關鍵詞能夠完整匹配用戶的搜索詞,則相關性高,即使沒能完整匹配,但是關鍵詞之間距離很短,這樣也會被認為相關性較高。
錨文本和權(quán)重,頁面的權(quán)重對關鍵詞的相關性影響非常大,而錨文本的重要性與頁面的權(quán)重幾乎相當,如果錨文本的錨點采用的是用戶搜索的關鍵詞,那么這個錨文本會給這個關鍵詞帶來很大的鏈接權(quán)重,包括錨文本周圍的文字也需要重點布局。
經(jīng)過以上這些關于頁面與關鍵詞之間相關性計算之后,網(wǎng)頁的排名結(jié)果頁就浮出水面了,接下來的工作就是搜索引擎調(diào)用頁面的標題,頁面描述,網(wǎng)址,快照等數(shù)據(jù)顯示在搜索結(jié)果頁面中。
我們通過幾篇文章介紹了搜索引擎的工作原理,要想做好網(wǎng)站優(yōu)化,理解搜索引擎的工作原理還是非常重要的,這樣我們的優(yōu)化才會更有目的性,希望能對大家有所幫助!