Vice-presidente do Google quer que site entenda mais de 6 mil línguas.
Gigante da web tem acervo de 12 milhões de livros digitalizados.
Há dez anos, seria impossível imaginar um computador capaz de analisar em alguns segundos o conteúdo de 12 milhões de livros em 400 línguas diferentes. Mas para o vice-presidente mundial de engenharia do Google, o banco de dados de mais de 5 bilhões de páginas digitalizadas que a empresa tem em seus servidores, totalizando cerca de 2 trilhões de palavras, não apenas servirá para arquivar o conhecimento humano, mas também servirá de instrumento para que os computadores possam ajudar no estudo da literatura e da evolução das línguas.
Alfred Spector é um dos principais defensores da tese de que a principal missão do Google é organizar toda a informação do planeta, e transformá-la em universalmente acessível e útil. De acordo com Spector, a facilidade com que os servidores da empresa trabalham com grandes volumes de dados torna possível realizar, em pouco tempo, estudos sobre as diferenças nas traduções de livros do latim para os idiomas modernos ao longo do tempo, ou mesmo entender como a conjugação de alguns verbos mudou nos últimos séculos.
“Há um campo imenso de pesquisa a ser feito nas ciências humanas utilizando os textos históricos que digitalizamos”, diz Spector. “Poderíamos, por que não, comparar todos os livros publicados na Inglaterra no século XIX para encontrar quais são os padrões nos textos que os estudiosos classificam como literatura da Era Vitoriana.”
O executivo aponta como exemplo um estudo realizado na universidade americana de Harvard. A partir da análise computacional de textos em inglês de diversas épocas, desde Beowulf, publicado entre os séculos VII e XI, até Harry Potter, o estudo mostrou como ocorreu a transformação da maioria dos verbos irregulares do inglês arcaico em verbos regulares, com conjungação mais simples.
Tradução
O armazenamento em forma digital de textos e a explosão exponencial do poder dos computadores também criaram a possibilidade do Google se transformar em um tradutor universal, eliminando uma das mais primitivas barreiras de acesso à informação: a língua.
Spector afirma que o Google Translate já consegue fazer traduções que nenhum ser humano vivo teria a capacidade de realizar. “Não creio que exista alguém que leia basco e maltês, ou que consiga adaptar um texto do islandês para o suaíl. Dos 58 idiomas que o Translate domina, tenho certeza que existe algum par de línguas que, para fazer a tradução, seria necessário traduzir uma delas para o inglês ou espanhol, por exemplo, para que outra pessoa fizesse enfim a transcrição para o idioma final.”