2014年5月29日 星期四

What we learned from 5 million books

What we learned from 5 million books?


Google將書籍數化後,
目前總共五百萬本書,
包含五千億個詞。
利用科學,
用程式,
讓這些資源,
可以在指間,
透過數據資料表,
呈現文化、趨勢及歷史,
即是culturomics,
包含了20億的n-grams。
例如thrive的過去式,
有人用throve,
也有人用thrived。
只要在相關網站Google Ngram Viewer鍵入關鍵詞,
就可以看到這個動詞過去式在不同年代使用的頻率,
也能看到語言的變化。
因而能知悉過去、現在,
展開文化了解的新頁。

沒有留言:

張貼留言