之前講到了 SEO 頻道,其中極其重要的一步,就是詞庫的建立了。 詞庫的整理和收集,一方面可以根據(jù)關(guān)鍵詞獲取到精準(zhǔn)的、大量的流量,另一方面也可以了解用戶的需求,方便第二步的模板設(shè)置。
關(guān)鍵步驟
SEO 詞庫一般有以下幾個(gè)關(guān)鍵步驟:
抓取
擴(kuò)展
過濾
補(bǔ)充字段 & 入庫
清理 & 優(yōu)化
第一步 關(guān)鍵詞抓取
關(guān)鍵詞抓取一般有以下幾個(gè)來源:
競爭對手詞庫
第三方工具,如 5118
PPC 或者其他流量渠道的關(guān)鍵詞
抓取的工具也有很多,比如:
火車頭
Python - scrapy
開發(fā)支持
不過需要注意的是,抓取工具一定要支持往下一層抓?。ㄒ步猩疃茸ト。?,而不能僅限于源頁面的抓取。
第二步 關(guān)鍵詞擴(kuò)展
抓取一批數(shù)據(jù)之后不要急著過濾和使用,要先擴(kuò)展一批。 這里可以借用搜索引擎的能力和工具進(jìn)行擴(kuò)展,有以下幾個(gè)方式:
搜索引擎的搜索框提示詞
搜索引擎的相關(guān)搜索詞
PPC 的擴(kuò)詞工具,如百度推廣助手的關(guān)鍵詞工具,Google Keyword Planner Tool.
擴(kuò)展一大堆關(guān)鍵詞之后還有非常重要的一步,就是關(guān)鍵詞分析,整理關(guān)鍵詞組合。 首先,通過分詞和整理,可以拿到關(guān)鍵詞的詞根,以及對應(yīng)的搜索量。 其次,手工把每個(gè)詞根對應(yīng)的關(guān)鍵詞組合整理出來,并加上搜索量和出現(xiàn)次數(shù) 最后,就是考慮這些關(guān)鍵詞怎么應(yīng)用。如果關(guān)鍵詞組合的搜索量特別大,而且主題明確且獨(dú)特,是建議單獨(dú)開設(shè)一個(gè)頻道,比如 「城市」+ 天氣。而對一些比較零散,無明確規(guī)則的關(guān)鍵詞,則是需要添加到 SEO 頻道,比如 “杭州八景”。 借用一張 GoGo闖 博文中的一張圖:
注:GoGo闖 有一篇講關(guān)鍵詞分析的文章,這里推薦一下《【如何搭建SEO詞庫?】SEO關(guān)鍵詞分析》。
第三步 關(guān)鍵詞過濾
SEO 入庫前還需要進(jìn)行過濾。以下關(guān)鍵詞過濾的具體規(guī)則(應(yīng)該是中文最全的規(guī)則了):
單復(fù)數(shù)過濾,比如 led light 和 led lights
前后順序調(diào)整過濾,比如 led light 和 light led
空格處理,其中包含首尾空格去除、多個(gè)合并為一個(gè)
特殊字符處理。除了字母和數(shù)字外的其他符號,都是特殊字符
大小寫處理。一般是全部轉(zhuǎn)換為小寫
年份替換,比如 2016 替換為 2018
去停止詞后去重。一定要注意,先去停止詞之后再去重,比如 “南京天氣” 和 “南京的天氣”,這樣就可以過濾掉
黑名單過濾。這里可以過濾掉包含黑名單里的關(guān)鍵詞,而黑名單可人工維護(hù),比如最近的一些敏感詞
違禁詞過濾,比如政治類敏感詞、侵權(quán)品牌類關(guān)鍵詞
結(jié)果數(shù)和相關(guān)性檔位過濾。根據(jù)搜索結(jié)果進(jìn)行過濾,比如相關(guān)性檔位為 3 的產(chǎn)品少于 20 個(gè),頁面就不會(huì)創(chuàng)建(或自動(dòng)添加 noindex)
純數(shù)字, 字母過濾。對中文站來講,純字母的關(guān)鍵詞比較偏向垃圾詞,對英文站則不然
語種過濾。中文站需要排除掉其他語向的關(guān)鍵詞
長度過濾??梢赃^濾掉過長或過短的關(guān)鍵詞
單詞數(shù)過濾,可以過濾掉一個(gè)單詞,或者超過3個(gè)單詞的關(guān)鍵詞
注:上述很多規(guī)則來自阿里內(nèi)部的關(guān)鍵詞過濾工具中的功能。
第四步 補(bǔ)充字段 & 入庫
入庫時(shí)除了關(guān)鍵詞以外,還需要補(bǔ)充相關(guān)的字段(對應(yīng)每個(gè)數(shù)據(jù)庫字段) 一般有以下數(shù)據(jù):
關(guān)鍵詞
行業(yè)分類,比如屬于 3C 行業(yè)
關(guān)鍵詞類型,比如是 price 類
添加時(shí)間
修改時(shí)間
添加人
搜索量
百度 / Google 結(jié)果數(shù)
分詞結(jié)果,比如 “南京|旅游|攻略”
第五步 清理 & 優(yōu)化
清理是為了剔除掉低效的頁面,保證頻道的效率。比如近一年內(nèi)沒有任何流量的頁面。
優(yōu)化是精細(xì)化的運(yùn)營,比如有一批頁面一直未抓取,則添加一批內(nèi)鏈促進(jìn)其抓??;或者排名在第二頁但仍有流量,則需要稍微給一點(diǎn)內(nèi)鏈幫助其上升到第一頁
其他高級功能
隨著詞庫規(guī)模的擴(kuò)大,會(huì)遇到更多問題。這些都是考慮和解決的。
聚類??梢越鉀Q頁面重復(fù)的問題,提高頻道效率。
分類。可以根據(jù)不同的關(guān)鍵詞類型,使用不同的模板,以更好的滿足用戶需求。
傾斜。根據(jù)搜索量或者轉(zhuǎn)化率,資源向部分頁面傾斜。
站群的詞庫
最后多說一點(diǎn),我也做過站群的詞庫。 在站群項(xiàng)目中,內(nèi)容、抓取量、鏈接資源都是極其有限的。這個(gè)時(shí)候,詞庫就顯得極其重要。 一個(gè)好的詞庫,比一般詞庫的效果要好上幾十倍。 而好的詞庫,甚至不惜人肉整理。幾萬個(gè)關(guān)鍵詞人工篩選。