A atividade típica de um Cientista de Dados envolve a implementação de diversos processos que caracterizam experimentos de análise de dados. Nestas análises há a necessidade de executar diversos códigos em diferentes linguagens de programação (Python, R, C, Java e Scala) em diferentes ambientes de processamento paralelo e distribuído. Dependendo da complexidade do processo e das inúmeras possibilidades para execução distribuída destas soluções, pode ser necessário gastar muito energia em diferentes implementações que afastam o Cientista de Dados do seu objetivo final, que é produzir conhecimento a partir dos grandes volumes de dados. Dentro deste contexto, este trabalho visa apoiar na solução de tal dificuldade ao propor a construção de um framework concebido a partir de uma abordagem algébrica que isola a modelagem do processo da dificuldade de executar, de modo otimizado, tais workflows. A proposta apresenta um workflow típico de Extract Transform Load (ETL) para realização de análise de dados e aponta para resultados promissores em termos de representação e potencial de abstração/isolamento do ambiente de execução.
O constante aumento de congestionamentos no tráfego rodoviário demanda pesquisas relacionadas a mobilidade urbana. Esses estudos modelam a análise do tráfego como um problema de trajetória, i.e., a partir da análise individualizada de veículos que continuamente transmitem suas geolocalizações. Tais objetos móveis funcionam como sensores de trajetória e produzem grande quantidade de dados. Observa-se, entretanto, que há uma lacuna de estudos associados a agregações espaço-temporais das trajetórias dos veículos urbanos. Como um trabalho preliminar no assunto, este artigo estabelece uma base de comparação para identificação de anomalias em mobilidade urbana, que pode ser útil para o desenvolvimento de novas abordagens que provenham uma maior compreensão dos sistemas de mobilidade urbana.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.