Web pages can be written using development techniques that allows in stages loading. Such possibility, presented by some technologies as AJAX, brings a new challenge to the development of applications that need to recover web pages in an automatic and large scale way. In such context, a computing solution has been created to interpret web pages with AJAX dynamic content, aiming at the using of pure HTML code in application for web information localization.
RESUMOPáginas na web podem ser escritas seguindo técnicas de desenvolvimento que permitem carregamento por etapas. Essa possibilidade, apresentada por tecnologias como AJAX, traz um novo desafio ao desenvolvimento de aplicações que necessitem recuperar páginas na web de forma automatizada e em larga escala. Considerando esse cenário, foi desenvolvida uma solução para interpretação de páginas com conteúdo dinâmico criado em AJAX, visando o tratamento de código HTML puro em aplicações para localização de informações na web.A construção de páginas web utilizando conteúdo dinâmico é um fenômeno cada vez mais freqüente. Nessas páginas, marcações HTML, utilizadas pelos navegadores para a construção da representação visual apresentada ao usuário, são criadas em tempo de execução. Recursos como JavaScript [1], executados pelos navegadores durante a renderização da página, fornecem novas funcionalidades não presentes originalmente na Internet. Esses recursos moldam a estrutura da agora nomeada Web 2.0 [2].Na web está disponível uma grande quantidade de informações, muito além do imaginado inicialmente para esse serviço. Percebese que tão importante quanto gerar, armazenar e distribuir essas informações é oferecer mecanismos para localizá-las adequadamente. Os usuários da web desejam acessar as informações corretas para suas necessidades, em um menor tempo possível. No ainda curto tempo de vida da web, diversas soluções de busca foram criadas [3], atendendo tanto demandas gerais quanto específicas.A tecnologia AJAX (Asynchronous Javascript And XML) [4] permite que as páginas sejam carregadas por etapas. Utilizando scripts seguindo a linguagem JavaScript e estruturas de dados formatadas com XML, AJAX possibilita a adição de conteúdo dinâmico às páginas na web. Com isso, a página exibida ao usuário final é dependente da interpretação dos scripts pelo navegador, que pode, inclusive, solicitar interação direta do usuário com o browser.A localização de informações é dependente da análise prévia de grandes quantidades de páginas HTML. Em um cenário de Web 2.0, recursos que adicionam interatividade apresentam novos desafios à análise do conteúdo HTML das páginas. Softwares de busca precisam acessar o conteúdo de uma página para criar estruturas que facilitem sua localização, de forma fácil e eficiente pelo usuário. A utilização de conteúdos dinâmicos dificulta essa análise, já que o código HTML da página não está presente durante sua análise, uma vez que seu conteúdo final é dependente de interpretação.Considerando esse cenário, foi desenvolvida uma solução para transformar pág...