百度站長俱樂部:我知道大多數(shù)站長,會使用不帶關(guān)鍵詞的site語法來進(jìn)行收錄量觀察。這是一種方法,但很不準(zhǔn)確。site語法設(shè)定的初衷,其實(shí)是期望用戶可以設(shè)定約束搜索范圍,實(shí)現(xiàn)更加精準(zhǔn)的搜索。這同intitle,inurl,本質(zhì)上是相同的。而在這些高級語法下的結(jié)果數(shù),和常規(guī)搜索一樣,都是“估值”,而非精確值。因此,很有可能site下的“結(jié)果數(shù)”減少了,實(shí)際被索引數(shù)卻可能增加了。
更加精確的方法是什么呢?
1,對來自搜索引擎的流量進(jìn)行監(jiān)控。這是最直接和本質(zhì)的。如果流量沒有大的波動,而site下的數(shù)值發(fā)生巨大波動,這只能說明site搜索結(jié)果數(shù)的不精確性。
2,對站內(nèi)url進(jìn)行抽樣監(jiān)控。有些url已經(jīng)被搜索引擎收錄了,那么取出一個集合,作為收錄狀態(tài)監(jiān)控集;每天的新url尚未被收錄,也可以對其進(jìn)行索引狀態(tài)的監(jiān)控。腳本是很容易寫的,這種基于抽樣的評估也是很有效的。
3,由搜索引擎提供的統(tǒng)計(jì)工具。我們是否應(yīng)該提供類似統(tǒng)計(jì)工具,目前還在評估中。
看到一則反饋,直接貼一下:莆田SEO還是有點(diǎn)小疑問的,希望能拋磚引玉,大家探討一下。
1、如果流量沒有大的波動,但實(shí)際上新的頁面是已經(jīng)被收錄,只是因?yàn)榕琶缓茫圆]有流量過來,這樣子的話也不能說site的結(jié)果不準(zhǔn)?只能說是權(quán)重不夠高。因?yàn)橐粋€新站,前期一定只是一個積累的過程,可能流量并不是那么的重要,但是收錄的確還是很重要的。代表的是,你已經(jīng)進(jìn)入了百度的索引了。 2、url抽樣監(jiān)控,這樣子的一個收錄監(jiān)控方式,我想,對于我們這些小站長或是個人站長來說,在現(xiàn)階段來說,在高手眼里的小技術(shù)的腳本,可能就是一座難以逾越的大山。而互聯(lián)網(wǎng)上,因?yàn)閬碚f草根站長是占了絕大的一部分。 3、如果是百度提供類似統(tǒng)計(jì)工具,我相信站長們都是無上歡迎的。 4、其實(shí)site來說,對于站長本身,很大一部分就是讓自己心里有了一個底,可以用一個腳本來替換得到更準(zhǔn)確的值的確是可行的,而且自己是可以通過流量統(tǒng)計(jì)后臺來實(shí)現(xiàn)成效的檢驗(yàn)的。但是有一點(diǎn)可能被您給忽略了,site用的最多的場合不是自用,而是交換友情鏈接的時候用的。估計(jì)很小部分的人會交換一個友情從而去動用腳本去檢測索引對方網(wǎng)站的具體數(shù)據(jù),這一塊,要如何更好地解決呢? |
對莆田seo的問題回復(fù)一下:
1,已經(jīng)強(qiáng)調(diào)過很多次了,百度site語法的結(jié)果數(shù)不準(zhǔn)。而且這種不準(zhǔn)的幅度甚至不是穩(wěn)定的,可能今天比較接近真實(shí)值,明天就發(fā)生大波動了。其中的原因不便多解釋。
2,沒有想像那么難。連備案這種復(fù)雜的事情都能搞定,學(xué)點(diǎn)腳本編程,實(shí)在不算什么。而且,作為站長,如果想深入的研究sem,我可以坦白的講,數(shù)據(jù)分析是必須的。在網(wǎng)絡(luò)上搜到的東鱗西爪的所謂seo技巧,大多是別人嚼剩下的、沒什么大用的、甚至有害的東西。站長要學(xué)會的首要事情之一,是對自己的網(wǎng)站日志做深入解剖,并能針對問題做各種實(shí)驗(yàn)和分析。
3,略。
4,有一點(diǎn)可以肯定,索引結(jié)果數(shù)肯定不會是一個網(wǎng)站在搜索引擎中的站點(diǎn)評級指標(biāo)。這是很容易理解的。舉個例子,site:www.job631.com,就幾百條而已。從投票權(quán)角度,它的權(quán)重會低于大部分索引了成千上萬網(wǎng)頁的站點(diǎn)?所以站長若要搞搞友情鏈接,更重要的是用自己的經(jīng)驗(yàn)去做價值分析——他是想撈一票就走的,還是想正經(jīng)在互聯(lián)網(wǎng)上立立腕兒的。
附站長比較關(guān)注的問題:
站長問:最近有很多站都遇到這個情況,剛發(fā)布的文章都會很快被百度收錄,可過不了多長時間(8到24小時)又會被百度刪除,然后再過同樣多的時間百度重新收錄!
百度站長俱樂部答:這是我們系統(tǒng)的一個缺陷,正在修復(fù)中。預(yù)計(jì)很快就不會有這種讓人faint的事情出現(xiàn)了
站長問:一個站長都普遍疑惑的問題,那就是為什么有些站每天不更新反而百度的快照天天新。有些站提供原創(chuàng)內(nèi)容每天更新反而百度快照不更新。是由于受到技術(shù)的局限還是對這個站的懲罰!如果是懲罰那么為什么那些天天不更新反而更占優(yōu)勢呢?
百度站長俱樂部答:我們內(nèi)部也對結(jié)果頁上的時間戳(在url后面)很糾結(jié),有計(jì)劃整改。實(shí)際上有的搜索引擎早已經(jīng)把這個時間戳去掉了,而代之以網(wǎng)頁更新的實(shí)際時間。這個時間戳既然給內(nèi)部人員也帶來了困擾,那么對站長和用戶,顯見也是有困擾的。所以,我的建議是不必太過關(guān)注這個時間戳。如果期望看到精確的spider行為,最直接的手段是分析網(wǎng)站日志。我個人覺得站長如果想做出點(diǎn)名堂,一些起碼的技術(shù)手段還是要會的,數(shù)據(jù)分析對SEM極端重要。而不要動輒用“草根”來給自己開脫。
站長問:在交流中發(fā)現(xiàn)很多人認(rèn)為:用site語法查詢之后,如果排在第一的不是該網(wǎng)站的首頁則表示該網(wǎng)站被百度降權(quán)。這種做法是否想當(dāng)然?
百度站長俱樂部答:site語法查詢的檢索結(jié)果,更多情況下類似隨機(jī)的排序,除了說明這些網(wǎng)頁已經(jīng)被收錄以外,不能說明任何問題。