Proceedings of the Seventeenth International Conference on Artificial Intelligence and Law 2019
DOI: 10.1145/3322640.3326727
|View full text |Cite
|
Sign up to set email alerts
|

Automatic Construction of a Polish Legal Dictionary with Mappings to Extra-Legal Terms Established via Word Embeddings

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
2
0

Year Published

2020
2020
2024
2024

Publication Types

Select...
3
2
1

Relationship

0
6

Authors

Journals

citations
Cited by 6 publications
(5 citation statements)
references
References 5 publications
0
2
0
Order By: Relevance
“…Word2vec is a word embedding method proposed by Mikolov, et al, in 2013 [19]. Since then, word2vec has been widely applied in the literature [20], [21]. Word2vec is a two-layer shallow neural network used to learn the embedding of words by exploiting word co-occurrence in a contextual window.…”
Section: ) Word2vecmentioning
confidence: 99%
See 1 more Smart Citation
“…Word2vec is a word embedding method proposed by Mikolov, et al, in 2013 [19]. Since then, word2vec has been widely applied in the literature [20], [21]. Word2vec is a two-layer shallow neural network used to learn the embedding of words by exploiting word co-occurrence in a contextual window.…”
Section: ) Word2vecmentioning
confidence: 99%
“…To find terms with close contexts, the cosine similarity is computed in-between the context vectors provided by the word2vec models. The cosine similarity cos(θ), between two vectors A and B, of dimension n, is computed as follow [21]:…”
Section: ) Cosine Similaritymentioning
confidence: 99%
“…Tal como no setor de petróleo e gás, a área jurídica compreende uma linguagem com características próprias na qual, por vezes, determinadas palavras possuem significados totalmente diferente da linguagem dita natural. Em [Smywiński-Pohl et al 2019], são treinados modelos Word2vec e Glove e visando a criac ¸ão de dicionário que fornec ¸a uma interface entre palavras técnicas da justic ¸a polonesa e palavras que possam ser compreendidas por leigos. Os experimentos apontaram resultados superiores para o Word2vec do tipo CBOW.…”
Section: Embeddings Orientado Ao Segmento Jurídicounclassified
“…A abordagem lexical é um recurso presente em várias atividades de processamento de linguagem natural, como análise de sentimentos, classificac ¸ão de textos, recuperac ¸ão de opinião e identificac ¸ão de temas, entre outras. Quando elaborados de forma adequada, os léxicos podem fornecer uma boa capacidade de classificac ¸ão, além de poderem ser utilizados como recursos adicionais aos modelos de aprendizagem de máquina [Oliveira et al 2016] Detectar subjetividades em sentenc ¸as e classificálas em uma classe é um desafio, especialmente em domínios específicos, como o mercado de ac ¸ões [Das et al 2022], doenc ¸as [Jung et al 2021], documentos jurídicos [Smywiński-Pohl et al 2019] e outros que exigem corpora especializado.…”
Section: Trabalhos Relacionadosunclassified
“…Para isso, foi utilizado documentos de textos extraídos do portal U.S Securities and Exchange Commission entre 1994 e 2008, resultando em seis grupos de palavras. Outra abordagem é de forma automática, como o realizado por [Smywiński-Pohl et al 2019]. Neste é proposta a construc ¸ão de um dicionário polonês, que mapeia a relac ¸ão entre os termos jurídicos e extrajurídicos.…”
Section: Trabalhos Relacionadosunclassified