úterý 11. ledna 2011

Jak si představit 100 GB Google textových dat?

Zajímavé novinky pohlížet http://rss.slashdot.org/~r/Slashdot/slashdot/~3/lRQnkESVHZc/story01.htm:
Anonymní čtenář píše "Je úžasné série grafů, které zobrazuje trigrams a bigrams, části vět, které byly získány z údajů webu Google set. Grafů zdůraznit slovní asociace a frekvence, se kterou používáme je na webových stránkách. Chris Harrison z Carnegie Mellon University zjistili, že například slovo 'on' je často vázáno na 'tvrdí,' když 'ona' je nalezen často s 'miluje.' Tam jsou také slovo-vztahové diagramy, které zdůrazňují slova použita v kombinaci s jejich protiklady, jako jsou dobré a špatné, míru a války, a PC a Mac. " Existuje mnoho z těchto věcí, a oni jsou opravdu zajímavé procházet.

Přečtěte si více o tomto příběhu na Slashdot.




Žádné komentáře:

Okomentovat