terça-feira, 17 de março de 2009

Teorizando sobre dados

Em palestra recente no TED, Tim Berners-Lee aborda o tema da publicação de dados brutos na Web. Na sua visão, existem muitos dados escondidos em bancos de dados não acessíveis na internet. Estes dados disponíveis em padrões aberto poderiam formar um campo de exploração para pesquisadores do mundo todo. Recomendo!



Acredito que o potencial para pesquisa com base nestes dados é enorme, não só em dados brutos mas no que temos hoje na Web. Um dos exemplos que considero excepcional é o aprendizado de idiomas com base em textos da Web em diferentes línguas. Na palestra do Peter Norvig, ex-NASA e atual pesquisador do Google, ele mostra como são usadas técnicas computacionais para melhorar as traduções automáticas. O sistema é treinado com o volume de dados superior a qualquer sistema tradicional e os resultados mostram a diferença: o uso da Web com base aumenta significativamente a qualidade das traduções.

"It’s a capital mistake to theorize before one has data.", já dizia Sherlock Holmes em suas investigações, 1891.

0 comentários: