10 de jun. de 2010

Google Muda Sistema de Indexação

Google implementa novo sistema de indexação de web:
google

Novo recurso foi criado para atender a demanda cada vez mais exigente de usuários que buscam informações mais específicas e atualizadas.

A Google anunciou na tarde desta terça-feira a conclusão do seu novo sistema de indexação de web, que recebeu o nome de Cafeína, divulgado em agosto do ano passado.

De acordo com o blog oficial da companhia o Google Caffeine permite que um usuário encontre links e materiais relacionados a um assunto específico 50% mais rápido do que no antigo sistema, além de agrupar a maior coleção de conteúdo web já oferecida.

O novo sistema de índex do buscador foi explicado pela engenheira de softwares Carrie Grimes: Nosso índice antigo tinha várias camadas; algumas eram atualizadas em um ritmo mais rápido do que outras, e a camada principal era atualizada a cada duas semanas. Para atualizar uma camada do índice antigo, nós analisávamos toda a web, o que implicava em um atraso significativo entre o momento em que encontrávamos uma página e a disponibilizávamos para o usuário. Com o Caffeine a análise da web é feita em pequenas porções e a atualização do índice de pesquisa é feita sobre uma base contínua, de forma global. À medida que novas páginas ou informações sobre as páginas existentes são encontradas ela são adicionadas diretamente no índice. Isso significa que o usuário pode encontrar informações mais novas independente de quando ou onde ela foi publicada.

Para entender melhor o funcionamento do Google, basta pensar no buscador como um livro: o índice ajuda o usuário a encontrar um determinado capítulo ou assunto em meio às páginas da publicação. Quando alguém procura algum assunto utilizando o Google, essa busca não é feita em tempo real na internet e sim dentro do índice disponibilizado ao sistema, que facilita o buscador a encontrar o maior número de assuntos relacionados ao tema escolhido.

Como o volume de informação na internet têm crescido muito rapidamente, não apenas em tamanho e número mas também em imagens, notícias e atualizações em tempo real – graças a grande incorporação de vídeos na web – as páginas têm se tornado cada vez mais complexas e ricas em conteúdo. Isso fez com que o perfil dos usuários mudasse, tornando-os mais exigentes em relação aos resultados esperados.

Foi diante desse novo panorama que a empresa sentiu a necessidade de melhorar seu sistema de busca, para atender a nova demanda de informações exigida por seus usuários.

O novo índice do Google ocupa quase 100 milhões de gigabytes de armazenamento em um banco de dados e adiciona novas informações a uma taxa de centenas de milhares de gigabytes por dia. Para armazenar esse volume de informação seriam necessários aproximadamente 630 mil iPods da maior capacidade disponível hoje no mercado que, se colocados um atrás do outro, chegariam a uma extensão de 40 km.

fonte: geek

Acho que a busca do Google é o único serviço decente da empresa. O resto...

Nenhum comentário:

Postar um comentário

Deixe seu recado, sugestão ou opinião. Mas não toleramos ofensas, abusos ou spam. Todos os comentários são de inteira responsabilidade do autor. Obrigado.