Similarity Group-by Operators for Multi-Dimensional Relational Data

Tang, Mingjie; Tahboub, Ruby Y.; Aref, Walid G.; Atallah, Mikhail J.; Malluhi, Qutaibah M.; Ouzzani, Mourad; Silva, Yasin N.

doi:10.1109/tkde.2015.2480400

Cited by 20 publications

(15 citation statements)

References 22 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…The vast majority of them focuses on the Selection [Silva et al 2013] in which similarity awareness is achieved by means of range queries, nearest neighbors queries, and their many variants. Recent works also focus Grouping and Aggregation [Tang et al 2016] and the set-based operators [Al Marri et al 2016]. However, to the best of our knowledge, no one focuses on the Division.…”

Section: Basic Concepts and Related Workmentioning

confidence: 99%

The similarity-aware relational division database operator

Gonzaga

Cordeiro

2018

Anais Do Concurso De Teses E Dissertações Da SBC (CTD-SBC)

View full text Add to dashboard Cite

This paper describes the motivation, contributions and impact of the MSc. dissertation that proposes the first Similarity-aware Division (÷) database operator. The novel operator is naturally well suited to answer queries with an idea of "candidate elements and exigencies" to be performed on complex data from real applications of high-impact, such as in agriculture, genetics, industrial production, digital libraries and enterprise management.

show abstract

Section: Basic Concepts and Related Workmentioning

confidence: 99%

The similarity-aware relational division database operator

Gonzaga

Cordeiro

2018

Anais Do Concurso De Teses E Dissertações Da SBC (CTD-SBC)

View full text Add to dashboard Cite

show abstract

“…No entanto, para alguns critérios de consultas por similaridade, tais como os k-vizinhos reversos ou as consultas com diversidade, ter acesso à totalidade do domínio ativo é a única forma de garantir a ordenação por distâncias (KORN; MUTHUKRISHNAN, 2000;SILVA et al, 2013). Para estas consultas podem ser traçadas duas alternativas, a saber, a extensão de outro operador que dê suporte à ordenação considerando um novo critério (GARCIA-MOLINA; ULLMAN; WIDOM, 2000; DATE, 2011); ou, a extensão do operador de Seleção para que este realize a filtragem e a ordenação dos elementos filtrados (CARVALHO et al, 2014;TANG et al, 2016). Em ambas as alternativas, é necessário explorar as consequências sobre os operadores relacionais já existentes, quais propriedades algébricas permanecem inalteradas e como isso afeta a otimização lógica de consultas, como discutido em Ferreira et al (2011), Aly, Aref e Ouzzani (2015).…”

Section: Operadores Relacionais E Consultas Por Similaridadeunclassified

“…Muitos desses protótipos também definem extensões para a linguagem SQL (AMATO; MAINETTO;SAVINO, 1997;BARIONI et al, 2009;BUDIKOVA; BATKO; ZEZULA, 2012) e utilizam estruturas de indexação concebidas especificamente para consultas por similaridade (CIACCIA; PATELLA; ZEZULA, 1997; TRAINA JR. et al, 2000;SKOPAL; POKORNỲ; SNASEL, 2004; NOVAK; BATKO; ZEZULA, 2011; CHEN et al, 2017b). De forma paralela, trabalhos recentes têm focado na extensão da álgebra relacional para definir novos operadores relacionais que incluam os comparadores por distância (SILVA et al, 2010;MARRI et al, 2014;TANG et al, 2016). Portanto, dentre os pontos acima destacados, o otimizador de consultas é o ponto que apresenta menor desenvolvimento, pois, além de depender das definições algébricas dos itens 1 e 2, depende também da definição de um ferramental estatístico diferente do usado para as Relações de Identidade e Ordem já presentes em um SGBD.…”

Section: Introductionunclassified

Modelos de custo e estatísticas para consultas por similaridade

Bêdo¹

View full text Add to dashboard Cite

Dedicado a todos aqueles que buscam alguma resposta para quaisquer dos infinitos mistérios da Natureza. Agradecer, em especial, ao meu orientador, o Prof. Caetano Traina Jr. pelas diversas horas de discussão, brilhantes ideias e direcionamentos (desde o período de iniciação científica) que se refletem sobre todo o texto deste trabalho. Um agradecimento, também especial, à Profa. Agma J. M. Traina, por tantos conselhos e sugestões durante a execução de todas as atividades desta tese. Aos demais professores do Grupo de Bases de Dados e Imagens, Profs. Elaine Parros, José F. R. Júnior e Robson Cordeiro pelos ensinamentos colhidos nas disciplinas, reuniões de grupo e conversas individuais. Não obstante, agradecer também ao Prof. Daniel S. Kaster, da Universidade de Londrina, pelas (muitas) horas gastas em vídeo-conferências discutindo implicações (filosóficas, práticas ou não-correlatas) de muitas das premissas deste trabalho. Finalmente, agradecer aos amigos da Universidade de São Paulo que compartilharam essa jornada em termos de tempo, ensinaram-me muitas coisas e aprenderam de mim outras tantas, e que, agora, partem em suas jornadas por diferentes locais do país. Por ordem alfabética, agradeço aos Srs. Daniel Chino, Davi P. Santos, Lúcio F. D. Santos, Luiz Olmes e Willian D. Oliveira. Aos demais professores e amigos, com os dois termos agora já quase indistinguíveis, cujo nome, por acaso, tenha me escapado nas linhas anteriores deixo aqui também o meu sincero agradecimento. Pesquisa parcialmente desenvolvida com apoio de bolsa institucional do Programa de Pós-Graduação em Ciências de Computação e Matemática Computacional PROEX-5991854/D oriunda da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) no período de 07/2014 a 04/2016. A execução deste trabalho só foi possível devido a infra-estrutura disponibilizada pelo Instituto de Ciências Matemáticas e de Computação e devido ao auxílio dos competentes servidores técnico-administrativos do referido Instituto. Um agradecimento especial à Profa. Angela C. P. Giampedro, atualmente na chefia do Centro Cultural da Universidade de São Paulo em São Carlos, pela imensurável ajuda na escrita dos textos em inglês relacionados a esta tese. "Rerum omnium magister usus" (A experiência é a mestra de todas as coisas, tradução livre)-Gaius Iulius Caesar, benfeitor romano Palavras-chave: Consultas por similaridade, Otimização, Concentração de distâncias.

show abstract

“…In this case, three groups will be formed: elements from 1 to 3 will belong to the first group; elements from 4 to 6 will belong to a second group; and elements from 7 to 10 will belong the a third group. Tang et al (2016) proposed the Similarity Group-By All that returns groups of elements whose pairwise distance between every element in the group is less than or equal to a threshold; and the Similarity Group By-Any, that creates groups in which one element must be similar to at least another element in the group. To deal with overlapping elements, the clause ON OVERLAP takes the following parameters: JOIN-ANY to assign element randomly to any overlapping groups;…”

Section: Similarity Queries In Metric Spacesmentioning

confidence: 99%

On the support of the similarity-aware division operator in a relational database management system

Vasconcelos¹

View full text Add to dashboard Cite

show abstract

Similarity Group-by Operators for Multi-Dimensional Relational Data

Cited by 20 publications

References 22 publications

The similarity-aware relational division database operator

The similarity-aware relational division database operator

Modelos de custo e estatísticas para consultas por similaridade

On the support of the similarity-aware division operator in a relational database management system

Contact Info

Product

Resources

About