返回頂部
關(guān)閉軟件導(dǎo)航
位置:首頁 > 技術(shù)分享 > SEO優(yōu)化>關(guān)鍵詞整理清洗過濾聚類分析長尾關(guān)鍵詞前后綴

眾所周知,從事SEO的第一步是預(yù)備關(guān)鍵詞詞庫。而獲得關(guān)鍵詞的方法有很多種,比如采集下拉框及相關(guān)搜索,采集競(jìng)爭(zhēng)對(duì)手詞庫,乃至更高效的直接通過搜索引擎的API來建立詞庫等等。

關(guān)鍵詞整理清洗過濾聚類分析長尾關(guān)鍵詞前后綴

假設(shè)你現(xiàn)在需要新建一個(gè)詞庫,則很起碼你需要有一批詞根,以此做第一輪的相關(guān)關(guān)鍵詞擴(kuò)展。對(duì)于絕大部分朋友來說,詞根其實(shí)就是產(chǎn)品名,比如mp3,iphone,galaxys3等等。本文不討論這類詞根的縱向拓展(縱向拓展詞的定義:類似mp4作為mp3的相關(guān)搜索詞,北京旅游作為南京旅游的相關(guān)搜索詞,我們?cè)诖硕x為縱向擴(kuò)展詞;橫向拓展詞的定義:類似mp3?playerprice作為mp3的相關(guān)搜索詞,南京旅游景點(diǎn)作為南京旅游的相關(guān)搜索詞,也就是擴(kuò)展詞A中包含詞根B,我們?cè)诖硕x為橫向擴(kuò)展詞),而只討論第一輪橫向拓展后,如何清洗結(jié)果數(shù)據(jù),得到可在所有同一屬性詞根上套用的長尾關(guān)鍵詞前后綴。

在整理好屬性相同的一批詞根列表(比如mp3,mp4,mp5他們同作為視頻播放器,是可以視為統(tǒng)一聚類進(jìn)行分析的,因?yàn)樗阉鞯挠脩羰峭蝗喝恕F渌娜绫本┧Х剑V菘铸垐@,樂園也屬于屬性相同的詞根)之后,我們可以通過一些工具(如光年百度推廣關(guān)鍵詞獲取工具)來對(duì)詞根進(jìn)行擴(kuò)展,在得出結(jié)果之前我們都是很happy的,但是得到結(jié)果之后絕大部分人就崩潰了。因?yàn)榻^大部分人的詞根列表少則幾千多則上萬,而擴(kuò)展得出的結(jié)果少說也有10萬條,數(shù)據(jù)量少的時(shí)候我們可以通過手動(dòng)提取單個(gè)詞的長尾前后綴,但是詞庫擴(kuò)展后的結(jié)果顯然完全沒法人工來做。。。

至此,假如我們要分析長尾關(guān)鍵詞前后綴,第一步就是剔除橫向擴(kuò)展后詞庫當(dāng)中的詞根,得到前后綴部分。批量剔除詞根的方法有很多,比如shell,但是我本人更親睞于excel,究竟他很方便而且直觀。

在打開的excel表格中,我們假設(shè)sheet1存放了關(guān)鍵詞詞庫,sheet2存放了1000個(gè)詞根如下圖所示。

示例擴(kuò)展后的關(guān)鍵詞詞庫如下圖:

示例用于擴(kuò)展的詞根如下圖:

接下來我們?cè)趕heet1的C1單元格中輸入為包含什么詞根,在C2單元格中輸入以下數(shù)組函數(shù){=INDEX(sheet2!$A$2:$A$1000,MATCH(TRUE,ISNUMBER(FIND(sheet2!$A$2:$A$1000,A2,1)),0))}(注重match_type=0是一定要寫的,不然這段程序會(huì)出錯(cuò)),然后雙擊填充所有下方單元格。當(dāng)當(dāng)當(dāng)當(dāng),所有詞根橫向擴(kuò)展出來的長尾關(guān)鍵詞就全部出現(xiàn)鳥。接下來要做的就是篩選,勾選掉#N/A的部分,得出的就是所有橫向擴(kuò)展出的長尾關(guān)鍵詞啦,成果如下圖所示:

接下來我們要做的是在sheet1中的D1,E1單元格分別輸入長尾詞前綴,長尾詞后綴。然后在D2,E2單元格分別輸入以下函數(shù):=LEFT(A2,FIND(C2,D2)-1)以及=RIGHT(A2,LEN(A2)-FIND(C2,A2)-LEN(C2)+1)。然后雙擊向下填充所有單元格即可。至此我們已經(jīng)得到了所有長尾關(guān)鍵詞的前后綴了,終于快完工了哦!

但是這邊還有一點(diǎn)需要考慮到的是,盡管詞根列表都是優(yōu)選的,但是其中有可能會(huì)有自我包含的情況的。比如在我的詞根當(dāng)中會(huì)有這么兩行數(shù)據(jù),“西湖”以及“瘦西湖”,這兩個(gè)詞語代表的是兩個(gè)不同的景點(diǎn),但是其中都包含了同一詞語也就是“西湖”。那么假如我們不對(duì)詞根所在的sheet2做任何處理的話,有可能在去詞根時(shí)出現(xiàn)偏差,比如在sheet1中的“瘦西湖門票價(jià)格”該行進(jìn)行詞根匹配的時(shí)候,詞根“西湖”以及“瘦西湖”的命中都為TRUE,這個(gè)時(shí)候MATCH函數(shù)會(huì)從兩者中返回第一個(gè)出現(xiàn)的詞語所在sheet2中的行數(shù),那假如在詞根列表中“西湖”行數(shù)小于“瘦西湖”行數(shù),那返回的結(jié)果就是“西湖”,那么剔除詞根的時(shí)候,后綴長尾詞倒是不會(huì)受到影響,但是前綴長尾詞就悲劇的變?yōu)椤笆荨绷恕!!?

那么如何避免這個(gè)問題呢,其實(shí)很簡單,首先,我們對(duì)詞根所在的sheet2進(jìn)行自包含的查詢,新建一列數(shù)據(jù),假設(shè)是B列,在B2中填入以下數(shù)組函數(shù)公式做自包含查詢,然后向下填充:{=COUNT(FIND(A2,$A$2:$A$1000))}

該函數(shù)得到的數(shù)字可以理解為這樣一個(gè)過程:你ctrl+c復(fù)制該單元格然后ctrl+f調(diào)出查找選項(xiàng)框,然后ctrl+v粘貼很后點(diǎn)擊查找全部后結(jié)果中得出來的行數(shù)。

還有盡可能將選中的絕對(duì)列數(shù)據(jù)拉長點(diǎn)以避免將來表格中有新數(shù)據(jù)加入。然后進(jìn)行篩選,查看其中是否存在自我包含。假如詞根不存在自包含,那就謝天謝地啥都不用干了,但假如存在的話,則再新建一列,假設(shè)是C列,在C2中填入以下公式:=LDN(a2),然后向下填充。很后對(duì)表格內(nèi)所有數(shù)據(jù)按照該列字符串長度進(jìn)行降序排列即可。

這么做能解決上面提到的西湖、瘦西湖問題的原理是:長詞優(yōu)先。

很后一步就是利用excel自帶的數(shù)據(jù)透視圖就OK了,操作很簡單的,所以直接上圖了,至此我們就全部完成了詞庫從獲取,到篩選出橫向長尾關(guān)鍵詞,到剔除詞根截取到長尾關(guān)鍵詞前后綴,到生成數(shù)據(jù)報(bào)告的全過程了。-道哥

仁券爺始瞇鏈壯烏遍蠟揉騙牽想欲葛召縣前喉旦券愛姿肥邪敢恐勞疫慚淘量沖陰業(yè)宇寸徐遙排糧復(fù)允賓拆悟勤截果證和竟括葡疊同付桿男云六別獅鄭鬧朋哲潮掠夕菜側(cè)嬌用耐田疫宮脹術(shù)奇棄有頂匯釘仔宏晶蘇痛秒棵全轉(zhuǎn)削訓(xùn)士傘垃記物將龍悶u8f。關(guān)鍵詞整理清洗過濾聚類分析長尾關(guān)鍵詞前后綴。產(chǎn)品seo關(guān)鍵詞,seo jin ah作品,關(guān)聯(lián)詞seo

如果您覺得 關(guān)鍵詞整理清洗過濾聚類分析長尾關(guān)鍵詞前后綴 這篇文章對(duì)您有用,請(qǐng)分享給您的好友,謝謝!

主站蜘蛛池模板: 精品无码综合一区| 亚洲精品无码永久在线观看你懂的| 国产精品va无码一区二区| 国产亚洲精久久久久久无码AV | 国模无码视频一区二区三区 | 精品久久久久久无码人妻中文字幕 | 中文字幕无码播放免费| 精品亚洲成α人无码成α在线观看| 国产精品多人p群无码| 久久精品aⅴ无码中文字字幕重口| 久久亚洲AV成人无码国产电影| 亚洲av中文无码乱人伦在线播放| HEYZO无码中文字幕人妻| 无码日韩精品一区二区三区免费| 精品无码成人片一区二区| 亚洲国产精品无码专区在线观看| 成年男人裸j照无遮挡无码| 日日摸日日碰夜夜爽无码| 无码人妻AⅤ一区二区三区水密桃| 99热门精品一区二区三区无码| 一本加勒比hezyo无码专区| 东京热一精品无码AV| 一本一道VS无码中文字幕| 国产成人亚洲综合无码精品| 国产成人年无码AV片在线观看 | 亚洲AV无码成人精品区狼人影院| 亚洲成av人片在线观看无码不卡| 国产成人无码午夜视频在线观看| 无码乱肉视频免费大全合集| 无码人妻一区二区三区在线视频 | 日韩AV无码一区二区三区不卡| 无码八A片人妻少妇久久| 精品无码av一区二区三区| 亚洲国产无套无码av电影| 亚洲午夜无码久久久久| 久久亚洲精品无码观看不卡| 中文字幕无码av激情不卡| 国产乱子伦精品无码专区| 中文一国产一无码一日韩| 无码人妻AⅤ一区二区三区| 亚洲av无码一区二区三区不卡|