, C, J. Y4 U' [% z
Google Correlate是Google Labs裡的一個新的實驗室項目,它可以幫你找到真實世界裡流行趨勢的搜索序列,有兩種呈現方式:按時間和按區域(暫時只支持美國地區)。比如咱們搜索「mittens」(手套),你就可以看到每年這個詞彙的搜索熱度(上圖藍色),每年都在冬季的時候火一下,然後迅速降溫。同時Google會列出10個(或更多)跟手套相關的搜索關鍵字,比如「knit hats」(針織帽),你可以對比針織帽(上圖紅色)和手套在各個時間段上搜索熱度的比較。由於搜索的趨勢(曲線)很類似,所以Google覺得針織帽和手套是同一類東西,這麼判斷確實很有道理。
+ l4 F( v. m$ b( ]4 q3 K+ r當然這也不是絕對的,比如搜索「losing weight」(減肥),可以看到人類真的是越來越胖了,對減肥的需求逐年增加(下圖藍色)。但這個趨勢居然跟「outside wedding」(室外婚禮)近似(下圖紅色),你就不能說減肥跟室外婚禮是同一類東西吧(也許室外舉辦婚禮是為了減肥?):
' n% t+ k. p5 F1 q1 i* s, L9 q0 A2 l( \4 B, a; t, J6 i7 o
更厲害的是,你可以自己畫一個趨勢圖,然後讓Google給你匹配出最符合的關鍵字。比如我畫這麼一個曲線,想看看啥玩意突然在08年火了,之後又突然銷聲匿跡了:
* J# ?, L8 [( k* x
4 ?8 @+ b6 p6 U( z. S結果匹配出來的結果裡,原來挪雞鴨6120突然在08年火了,然後很快又死翹翹了:
/ I* y% }& h& i4 @! P9 U. G除了時間匹配可以判斷出二者可能是同一類事務,地區匹配也是一個因素。還拿「mittens」(手套)來說,可以看到美國哪些地區對手套的搜索量最高,同時右邊則是針織帽的搜索量,二者在時間和地區上都很匹配,那基本可以證明它們是一類貨了:
( ?. j9 O+ ~6 {" E( D7 K; i7 A- q A& [
Google Correlate是個挺有意思的研究工具,尤其是允許自己畫趨勢曲線圖,大家不妨去試試看。
1 M* Q7 r& p0 K* I8 f3 p2 i- Z" M |