成都seo博客

蔡江博客

淺析詞頻位置加權排序算法

作者:choi 日期:2020-03-19 19:48 瀏覽:

  詞頻位置加權排序算法:是一種通過關鍵詞出現的位置和頻率進行排序的方法,它是搜索引擎最基礎的排序算法之一。當用戶通過關鍵詞進行搜索時,當某一個網頁中該關鍵詞出現的次數越多,位置越重要,則認為該網頁更加符合用戶的需求。早期大量的搜索引擎(如:Infoseek,Nutch,Excite,Lycos等)都基于該算法進行網頁檢索排序,當然在差別的搜索引擎中具體的排序方法有所差別。

  詞頻位置排序原理

  該算法以一個搜索詞與網頁的相關度大小當作排序尺度,而搜索詞在網頁中的相關度則由它在網頁中出現的次數和位置兩方面加權計算得到。在這種算法傍邊,詞對網頁的關聯性與詞在該網頁中的權值成正比。

  通過詞頻和位置加權,可以得出關鍵詞對網頁的權值。當用戶搜索該關鍵詞,搜索引擎根據檢索詞在差別網頁的相關度排序,這就是詞頻位置加權排序算法。

  詞頻加權的方法

  詞頻加權的方法有絕對詞頻加權、相對詞頻加權、反詞頻加權、基于詞分辨值加權等等。

  對于單一詞搜索引擎、簡單檢索需求,只用單純地計算一個詞在網頁中的出現頻率就可給定權值;而對于具有進行多重邏輯功能的搜索引擎,則必需綜合其它的加權排序方法。因為用多重邏輯檢索式檢索時,檢索結果跟檢索式中的每個搜索詞相關,而每個搜索詞在所有的網頁中出現的總頻率是不一樣的,如果根據總的權值來排序,就會導致結果的不相關。這時候就可以利用相對詞頻加權原理來解決:通過對大量網頁的統計,把越是在所有網頁中出現頻率高的詞給予一個較低的初始值;相對地,在所有網頁中出現頻率低的詞,給一個較高的權值。

  位置加權方法

  位置加權主要是通過對詞在網頁中差別位置和版式,給予差別的權值,從而按照權值來確定所搜索的結果和搜索詞的相關程度。

  詞的位置包羅:網頁標題、網頁描述,關鍵字、正文標題、正文內容、文本鏈接、alt標識等。

  版式包羅:字體、字號、有無加粗強調等。和傳統文獻一樣,一般在較重要的位置如標題、正文的結尾句等出現的詞給較大的權值。在抱負狀態下,這些差別的標簽對應的內容在表達網頁主題的能力上有所差異。通常字符較大、加粗強調的地方,一般也會給予更大的權值。

  實現步調

  該排序算法的實現基本步調是:采集網頁,解析網頁,過濾停用詞,獲取關鍵詞(中文自動切詞),按照關鍵詞的位置和頻次加權得出詞對網頁的相關度,用戶檢索時根據關鍵詞在網頁中的權值大小對該網頁進行排序。

  詞頻位置算法評價

  優點

  利用詞頻和位置加權算法是在傳統的文檔檢索理論和技術基礎上發展而來的,具有簡單、易實現的優點,是搜索引擎早期排序的主要思想,技術發展最成熟。

  缺點

  詞頻統計比力適用于布局化文檔數據,然而網絡時代的主要文獻是以網頁的形式存在的。算法僅僅按照詞頻和位置信息排序,根本沒有利用網絡中超文本的新特性,可以說是前網絡時代的技術。

  現在幾乎每個人都可以隨心所欲地在網上頒發各種內容,詞頻相同的兩個網頁,質量相差可以很遠,很難包管文檔的布局和文檔的質量。

  許多SEO網頁內容的制作者絞盡腦汁,在其頁面上堆砌關鍵詞,特別是在重要的位置(特別是<meta>)中放置主題無關的關鍵字。當用戶在瀏覽網頁時完全看不到,而在搜索引擎抓取時,卻能發現。對此搜索引擎也研究出各種方法來,發現和懲罰(黑帽SEO)這種作弊行為。

  總結:現在的搜索引擎開發了更加合理的鏈接分析算法,但是如果單純依靠鏈接分析,可能會發生主題漂移的問題。導致即使網頁的質量再高,再權威,如果搜索詞和網頁的相關度不高,對于用戶來說也是沒有用的。所以需要將鏈接分析與詞頻信息相結合,進行綜合的分析獲得更好地排序效果。目前詞頻位置加權排序算法仍是許多搜索引擎的核心排序技術。


文章來源:未知
文章標題:淺析詞頻位置加權排序算法
本文地址:http://www.5837392.live/seo/11227.html
相關文章
操作TF-IDF算法提升關鍵詞排名 操作TF-IDF算法提升關鍵詞排名

很多做SEO的朋友應該都傳聞過TF-IDF算法,網上大部門的介紹都是圍繞算法的公式和介紹,他們文章雖然很專業,但對付SEO優化

淺析詞頻位置加權排序算法 淺析詞頻位置加權排序算法

詞頻位置加權排序算法:是一種通過關鍵詞出現的位置和頻率進行排序的方法,它是搜索引擎最基礎的排序算法之一。當用戶

百度颶風算法3.0,針對跨領域采集及站群問題 百度颶風算法3.0,針對跨領域采集及站群問題

百度站長平臺在2019年8月8日這天發布了颶風算法3.0,本次算法的更新主要為了維護健康的移動生態,保障用戶體驗,包管優質

刷百度相關參數詳解,刷相關搜索的實現方法 刷百度相關參數詳解,刷相關搜索的實現方法

百度相關搜索詞可以為我們帶來精準的流量,同時也可以為我們引流,因此需要做相關詞的人很多,今天就來聊聊關于如何刷

淺談:個人的影視站怎么做SEO優化 淺談:個人的影視站怎么做SEO優化

這幾天有個朋友建了一個電影網站,于是找到表哥,問個人的電影網站怎么做SEO。下面表哥就總結幾點經驗跟大家聊聊,希望

搜索用戶建議專區上線公告 搜索用戶建議專區上線公告

近期,百度搜索資源平臺上線了搜索用戶建議專區,該專區收集展示了搜索用戶在使用您網站時,對網站內容和體驗等方面提

百度APP移動搜索落地頁體驗白皮書5.0 百度APP移動搜索落地頁體驗白皮書5.0

1.導言 2.面向對象 3.名詞解釋 4.落地頁體驗規范 4.1. 信息獲取規范 4.1.1 加載速度 4.2.頁面瀏覽規范 4.2.1 排版布局 4.2.2 字號間

程序員:我終于知道post和get的區別 程序員:我終于知道post和get的區別

IT界知名的程序員曾說:對于那些月薪三萬以下,自稱IT工程師的碼農們,其實我們從來沒有把他們歸為我們IT工程師的隊伍。

企業網站建設如何選擇企業cms建站系統 企業網站建設如何選擇企業cms建站系統

企業網站主要用于向外界展示企業產品和形象,如果網站內容豐富,頁面美觀,用戶體驗好,將會為企業帶來潛在的用戶,現

網站建設之常用CMS系統的SEO優化功能分析 網站建設之常用CMS系統的SEO優化功能分析

小編是CMS建站老司機,有多年的經驗也總結出了不少的優化經驗,現在大部分的網站,尤其是單位性質的網站基本都是采用

  • 精彩推薦
  • 最近發布
分享到:
Copyright © 2016-2021 「蔡江博客」版權所有
蜀ICP備15028159號-6  
網站地圖 | 技術支持:點瑞網絡
多人扑克牌玩法大全 打麻将 龙头股份股票 麻将推倒胡 国内股票市场分析 娱乐棋牌下载 微信捕鱼-捕鱼平台 四川血战麻将大胡有哪些 2019四肖八码期期准精选资料 股票程序化交易软件 多乐彩开奖直播