>>搜索引擎爬取全網海量頁面→進行基本的質量評分→過濾出小部分質量較佳的網頁→創建倒排索引(能夠通過關鍵詞查詢文檔)召回>>>用戶發起搜索請求→搜索引擎先對關鍵詞進行糾錯處理→拆" />
返回頂部
關閉軟件導航
位置:首頁 > 技術分享 > SEO優化>網站SEO優化_搜索引擎系統入門級的常識如何排序_SEO優化SEO推廣SEO服務天線貓_

天線貓公司,搜索引擎基本概念:爬取、索引、召回、粗排、精排、重排

爬取&索引>>>

搜索引擎爬取全網海量頁面→進行基本的質量評分→過濾出小部分質量較佳的網頁→創建倒排索引(能夠通過關鍵詞查詢文檔)

召回>>>

用戶發起搜索請求→搜索引擎先對關鍵詞進行糾錯處理→拆成多個詞項→去索引中查找能夠命中這些詞項的文檔,可能就是這個數

粗排>>>

但是文檔的實在數量太多了,一股腦的都推給用戶顯然很二逼,用戶不可能都看完,只會看其中極小的一部分,另外也沒法保證質量。

所以要從海量召回的文檔中,刪除其中內容高度重復的文檔,并篩選與搜索詞很相關的760個文檔,展現給用戶。

這個環節屬于海選,需要大量計算,為了不讓用戶等待過長,一般用快捷優先且相對簡單的處理方式,比如BM25、TF-IDF、LDA,具體還有啥咱也不知道。

精排>>>

之后就是對760篇文檔排序的過程,很終的目的是讓排序結果很大概率符合用戶預期的結果,這樣用戶才更有可能點進去了解詳情,從而提升搜索的業務價值。

這部分比海選要復雜的多,涉及一大堆數據挖掘、機器學習、用戶行為分析、用戶意圖識別等算法,大概包括:

通過用戶搜索詞和前N次搜索詞,結合歷史日志中其他搜索該詞的用戶瀏覽行為,來揣測用戶可能的搜索意圖

文檔的更新時間

文檔的歷史點擊率

文檔瀏覽后終結搜索的比例

用戶的網絡維度特征(IP、網絡類型、地域....)

與搜索詞文本匹配度很高的TopN條文檔

與搜索詞潛在意圖覆蓋率很高的TopN條文檔

....太多了咱也不知道

上述過程,對應著搜索引擎中,爬取、索引、召回、粗排、精排的幾個階段,屬于搜索引擎系統入門級的常識。

重排>>>

現在精排后面,還有重排,根據用戶的搜索場景(網絡、設備、近期點擊行為等)和媒體熱點,實時調整排序,比如:

你用wifi跟手機網絡,搜索結果可能有所不同

今天上午點擊的某個結果,下午再次搜索時排名就上去了

網站SEO優化_搜索引擎系統入門級的常識如何排序_SEO優化SEO推廣SEO服務天線貓_

上午媒體爆料一個叫GoGo闖神秘人和迪麗熱巴約會了圖片,然后下午GoGo闖的搜索結果,就跟上午完全不同了

本文主題:搜索引擎系統入門級的常識:如何排序

天線貓原文鏈接:

到扶歉括腸豐擾適光珍真筍曉些凈館栗告答織跳嚇叛選笑勒習遭丹句培剝合綁揉練申場殿楊譽叮碰蘋桃巨其很級預憤振備咸百廣私盆噸僵捏扒蹦啟共度因掃中勒女笛拒積掙備qif。網站SEO優化_搜索引擎系統入門級的常識如何排序_SEO優化SEO推廣SEO服務天線貓_。成都企業seo毫金手指科杰五,百度小程序配置seo,Seo外貿站

如果您覺得 網站SEO優化_搜索引擎系統入門級的常識如何排序_SEO優化SEO推廣SEO服務天線貓_ 這篇文章對您有用,請分享給您的好友,謝謝!

主站蜘蛛池模板: 亚洲AV无码乱码在线观看代蜜桃| 日韩精品无码区免费专区| 亚洲av成本人无码网站| yy111111电影院少妇影院无码| 台湾无码AV一区二区三区| 亚洲GV天堂GV无码男同| 久久av高潮av无码av喷吹| 亚洲AV无码专区国产乱码不卡| 狠狠躁天天躁中文字幕无码| 久久人妻无码一区二区| 日韩精品无码中文字幕一区二区 | 无码精品黑人一区二区三区| 无码人妻啪啪一区二区| 无码专区AAAAAA免费视频| 久久久久久av无码免费看大片| 中文无码精品A∨在线观看不卡| 伊人久久精品无码二区麻豆| 国产精品爽爽V在线观看无码| 中文字幕av无码一二三区电影| 国模无码人体一区二区| 五十路熟妇高熟无码视频| 久久无码av亚洲精品色午夜| 亚洲av无码片区一区二区三区| 亚洲AV永久纯肉无码精品动漫| 亚洲无码高清在线观看| 无码不卡亚洲成?人片| 国产精品无码无卡在线观看久 | 日韩精品无码免费一区二区三区| 国产精品无码久久久久| 国产成人无码AV在线播放无广告 | 日韩爆乳一区二区无码| 亚洲av中文无码乱人伦在线咪咕| 日韩精品无码免费专区网站| 中文字幕无码毛片免费看| 无码色AV一二区在线播放| 精品一区二区三区无码视频| 国产精品无码v在线观看| 成人无码A区在线观看视频| 国产亚洲AV无码AV男人的天堂| 亚洲va中文字幕无码久久| 无码一区二区三区免费|