Approximate personal name‐matching through finite‐state graphs

Gálvez, Carmen; Anegón, Félix de Moya

doi:10.1002/asi.20671

Cited by 30 publications

(18 citation statements)

References 78 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…The Analysis and recognition of the variants is very high through slightly hampered by a problem of over analysis owing to the fact that some strings contain errors. An inherent limitation of such string matching [6] approaches is that they cannot identify aliases. D. Bollegala, Y. Matsuo, and M. Ishizuka [7] the techniques involved in measuring similarities between words are pattern extraction, page count and word cooccurrence.…”

Section: Literature Surveymentioning

confidence: 99%

A Survey of Automatic Extraction of Personal Name Alias from the Web

Muthusamy¹,

Subramani²

2014

IJSIP

View full text Add to dashboard Cite

show abstract

Section: Literature Surveymentioning

confidence: 99%

A Survey of Automatic Extraction of Personal Name Alias from the Web

Muthusamy¹,

Subramani²

2014

IJSIP

View full text Add to dashboard Cite

show abstract

“…These studies did not aim to determine spelling mistakes for organization names (Galvez & Moya-Anegón 2006a;Galvez & Moya-Anegón 2007a). On the other hand, the study on standardizing author names was designed to find different versions of an author name (Galvez & Moya-Anegón 2007b).…”

Section: Previous Studies About Data Accuracy In Citation Indexesmentioning

confidence: 99%

Standardization problem of author affiliations in citation indexes

2013

Scientometrics

View full text Add to dashboard Cite

Academic effectiveness of universities is measured with the number of publications and citations.However, accessing all the publications of a university reveals a challenge related to the mistakes and standardization problems in citation indexes. The main aim of this study is to seek a solution for the unstandardized addresses and publication loss of universities with regard to this problem. To achieve this, all Turkey-addressed publications published between 1928 and 2009 were analyzed and evaluated deeply. The results show that the main mistakes are based on character or spelling, indexing and translation errors.Mentioned errors effect international visibility of universities negatively, make bibliometric studies based on affiliations unreliable and reveal incorrect university rankings. To inhibit these negative effects, an algorithm was created with finite state technique by using Nooj Transducer. Frequently used 47 different affiliation variations for Hacettepe University apart from "Hacettepe Univ" and "Univ Hacettepe" were determined by the help of finite state grammar graphs. In conclusion, this study presents some reasons of the inconsistencies for university rankings. It is suggested that, mistakes and standardization issues should be considered by librarians, authors, editors, policy makers and managers to be able to solve these problems.

show abstract

“…Estas iniciativas suelen centrarse fundamentalmente en tres áreas: las relacionadas con el diseño de esquemas para la descripción de registros de autoridades (desde las ISAAR CPF hasta los más recientes esquemas de metadatos como MADS o microformatos como VCard), las relacionadas con la creación de identifi cadores únicos, como el ISAN (Snyman, 2000) o DAI (Spanje, 2007) y fi nalmente las relacionadas con procesos de desambiguación de nombres en bases de datos (Torvik, 2005;Wooding, 2006;Gálvez, 2007). Asimismo, destaca el reciente trabajo aportado por el centro de investigación Ingenio (Pinar, 2007).…”

Section: La Variabilidad En La Forma De Los Nombresunclassified

Análisis de la variabilidad de nombres de autores españoles en depósitos digitales universitarios de acceso abierto: un estudio por áreas de conocimiento

Orduña-Malea

Peset

Ferrer-Sapena

2009

Rev. esp. doc. cient.

View full text Add to dashboard Cite

Resumen:. Los autores que fi rman con su nombre ofi cial español (dos apellidos y a veces dos nombres) o que varían su fi rma a lo largo del tiempo, tendrán más difi cultades para reunir su producción científi ca. A partir de la experiencia con Se descarga la base de datos de autoridades de los dos repositorios estudiados, se clasifi ca el estilo de fi rma -recomendando la que contiene dos únicas ristras de elementos-y se distribuyen los resultados según el sector de conocimiento, usando para ello las clasifi caciones temáticas del proyecto Intute y de la Agencia Nacional de Evaluación y Prospectiva (ANEP).El estilo de fi rma más usado es mediante dos apellidos (76 % en Recercat y 94 % en E-Prints Complutense). En cuanto a áreas temáticas, las ciencias sociales son las que presentan un mayor porcentaje de registros de autor con estilos de fi rma recomendados (un 20 % del total de registros pertenecientes a esta área).El nivel de uso del estilo de fi rma recomendado en ambos repositorios es bajo, especialmente en E-Prints Complutense. El índice de fi rma recomendado por sector científi co nos muestra el paisaje real de los mayores repositorios de acceso abierto españoles. Con esta información se puede diseñar una campaña de concienciación personalizada por sectores. Hipotéticamente pensamos que las ciencias más internacionalizadas o los autores vinculados a la documentación tendrán en cuenta estos aspectos de la fi rma, pero el estudio estadístico no lo ha corroborado, ya que son las ciencias sociales las que presentan el mayor nivel de uso de estilos de fi rma recomendados. Según los datos, las áreas tecnológicas, de salud y ciencias de la vida y de arte y humanidades precisan de campañas de concienciación evidentes. Sería deseable un estudio de las posibles diferencias en el uso de estilos de fi rma en función de quién alimenta las bases de datos.Palabras clave: normalización, control de autoría, repositorios de acceso abierto, estilo de fi rma recomendada, recercat, e-prints, complutense.

show abstract

Approximate personal name‐matching through finite‐state graphs

Cited by 30 publications

References 78 publications

A Survey of Automatic Extraction of Personal Name Alias from the Web

A Survey of Automatic Extraction of Personal Name Alias from the Web

Standardization problem of author affiliations in citation indexes

Análisis de la variabilidad de nombres de autores españoles en depósitos digitales universitarios de acceso abierto: un estudio por áreas de conocimiento

Contact Info

Product

Resources

About