2015 IEEE International Symposium on Multimedia (ISM) 2015
DOI: 10.1109/ism.2015.114
|View full text |Cite
|
Sign up to set email alerts
|

Self Similarity Wide-Joins for Near-Duplicate Image Detection

Abstract: Abstract-Near-duplicate image detection plays an important role in several real applications. Such task is usually achieved by applying a clustering algorithm followed by refinement steps, which is a computationally expensive process. In this paper we introduce a framework based on a novel similarity join operator, which is able both to replace and speed up the clustering step, whereas also releasing the need of further refinement processes. It is based on absolute and relative similarity ratios, ensuring that… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1

Citation Types

0
2
0
4

Year Published

2016
2016
2019
2019

Publication Types

Select...
3
2
1

Relationship

1
5

Authors

Journals

citations
Cited by 6 publications
(6 citation statements)
references
References 7 publications
0
2
0
4
Order By: Relevance
“…Furthermore, the data duplication technique [46], [47], [48], [49] optimizes database usage by reducing subsequent data match and comparing to bits of help reduce electricity consumption which can increase heat production. Another technique is Similarity Join Operator Technique [42], [50] that evaluate image similarity based on absolute ratios, whereas, Fourier Mellin Transform technique [51] helps image detection via image rotation, image scaling and invariant changes found in the image, followed by the Haar-wavelet technique [52], [53] that assist to extract features vector that is included in the image in order to find the Manhattan distance of the object in the image. Furthermore, kernel hashing technique [54] helps to detect the near-duplicate image by examining the various features contained within the image to detect the differences of each image and convert it to binary of images to place within the kernel space.…”
Section: B Image Features Extractionmentioning
confidence: 99%
“…Furthermore, the data duplication technique [46], [47], [48], [49] optimizes database usage by reducing subsequent data match and comparing to bits of help reduce electricity consumption which can increase heat production. Another technique is Similarity Join Operator Technique [42], [50] that evaluate image similarity based on absolute ratios, whereas, Fourier Mellin Transform technique [51] helps image detection via image rotation, image scaling and invariant changes found in the image, followed by the Haar-wavelet technique [52], [53] that assist to extract features vector that is included in the image in order to find the Manhattan distance of the object in the image. Furthermore, kernel hashing technique [54] helps to detect the near-duplicate image by examining the various features contained within the image to detect the differences of each image and convert it to binary of images to place within the kernel space.…”
Section: B Image Features Extractionmentioning
confidence: 99%
“…• Detecção de quase-duplicatas (near-duplicate detection) [85,18,21]: a detecção de objetos quase duplicados é importante em diversos contextos. Por exemplo, um sistema de arquivamento de informações médicas como o PACS (Picture Archiving and Communication Systems), é capaz de armazenar milhares de imagens de exames.…”
Section: Motivação E Problemáticaunclassified
“…1. Introdução que executa a consulta [62,38,18]. Apesar dos operadores de junção por similaridade realizarem a recuperação dos objetos mais similares, o quinto problema destes operadores é que, em geral, eles retornam um conjunto resposta de cardinalidade elevada.…”
unclassified
“…Caso verdade, o elemento candidato é influenciado por algum elemento em R e é marcado como um elemento influenciado podendo ser podado da resposta final (linhas 5-7). Por outro lado, se candidato não é influenciado por nenhum outro elemento em R div , então candidato é inserido no conjunto de resultado (linhas [11][12]. É importante notar que a quantidade de elementos selecionados depende da distribuição dos dados no espaço de busca ao redor do elemento s i ∈ S. Tal processo se repete até que todo conjunto de entrada R temp tenha sido avaliado (linha 3).…”
unclassified
“…Por outro lado, sempre que um candidato s c não faz parte de outro grupo de elementos muito similares em R, ele é inserido no conjunto de resultado como um representativo (linhas [12][13][14] e a influência é novamente ajustada de acordo com o posicionamento relativo e a quantidade de elementos no resultado, utilizando a heurística CB. Como exemplo, o elemento mais próximo de s q é sempre considerado o primeiro elemento representativo do conjunto e a sua distância ao elemento de busca é utilizada para definir o tamanho do grupo e a área de influência (ξ div1 = δ(s 1 , s q )).…”
unclassified