A petição inicial é um dos componentes mais importantes de um processo civil, de modo que a automatização da análise desses documentos pode diminuir o tempo necessário para que se cumpra a fase postulatória. O corpo de qualificação das partes, por sua vez, é a seção nesse documento onde são expostas as informações a respeito das entidades envolvidas no processo. Este artigo propõe o uso de técnicas de extração de entidades nomeadas no problema de identificação e extração de informações em petições iniciais. Para tal, foi produzida uma base de dados composta por corpos de qualificação das partes de petições iniciais extraídas de processos advindos de tribunais brasileiros. Foram treinados, avaliados e comparados sete modelos BiLSTM-CRF com combinações distintas de representações vetoriais de palavras, a fim de se investigar seus efeitos na performance de um algoritmo com essa arquitetura e, dessa forma, aprimorar o reconhecimento de entidades jurídicas em textos legais. Ao contrário de outros trabalhos baseados em BiLSTM-CRF para tarefas de NER no domínio jurídico, esta pesquisa dá ênfase não às arquiteturas empregadas, mas sim aos métodos de representação de texto usados. Os experimentos executados com o corpus desenvolvido mostram que o empilhamento de incorporações de caracteres, palavras e pooled FLAIR embeddings é a combinação preferível para extrair-se o melhor desempenho possível de modelos híbridos BiLSTM-CRF.
A correção automática de redações é um problema que vem sendo bastante explorado nos últimos anos. Um dos aspectos mais desafiadores nessa tarefa é avaliação do nível de domínio do aluno quanto aos mais variados tipos de estruturas textuais. A estrutura narrativa é um caso especialmente complexo devido ao seu caráter extremamente subjetivo. Trabalhos anteriores na área de correção textual, não abordaram o problema de automatizar a avaliação do nível de competência do aluno na escrita de narrativas. Este trabalho investiga o uso de algoritmos de aprendizagem de máquina para a detecção de clímax em redações em Português como um passo inicial na resolução do problema de correção automática de textos narrativos. Três algoritmos de classificação tradicionais, o support vector machine, floresta aleatória e descida de gradiente estocástica, foram aplicados em um conjunto de dados anotado traduzido para o Português. Os algoritmos foram avaliados em termos de precisão, revocação e pontuação F1, sendo a floresta aleatória o algoritmo de melhor desempenho. Além disso, foi realizado uma análise dos atributos envolvidos, e os experimentos mostraram que os melhores resultados são obtidos ao combinar-se atributos tanto do Coh-Metrix quanto do LIWC.
A utilização de Learning Analytics (LA) traz consigo diferentes benefícios às instituições de ensino. Porém, exige recursos computacionais e de internet inacessíveis às populações de baixa renda, tornando esta uma tecnologia que pode gerar desigualdade. Nesse contexto, este artigo tem dois objetivos: (i) apresentar o conceito de LA Desconectada, que permite a aplicação dessa tecnologia em ambientes com recursos limitados; e (ii) apresentar uma aplicação real para correção de produção textual de alunos de escolas públicas brasileiras, compatível com este conceito. O aplicativo permite a correção offline de redações escritas no papel e apresenta um dashboard impresso e com informações sumarizadas aos professores.
A classificação de textos considerando tipos textuais é de suma importância para algumas aplicações de Processamento de Linguagem Natural (PLN). Nos últimos anos, algoritmos de aprendizado de máquina têm obtido bons resultados nesta tarefa considerando textos em inglês. No entanto, pesquisas voltadas para a detecção de tipos textuais escritos em português ainda são escassas, e ainda há muito a ser estudado e descoberto nesse contexto. Assim, este artigo propõe um estudo experimental que investiga o uso de algoritmos de aprendizado de máquina para classificar textos em português considerando tipos textuais. Para isso, propomos um novo corpus composto por textos em português de dois tipos textuais: narrativo e dissertativo. Três algoritmos de aprendizado de máquina tiveram seu desempenho avaliado no corpus criado em termos de precisão, revocação e pontuação F1. Além disso, também foi realizada uma análise dos atributos envolvidos no processo para identificar quais características textuais são mais importantes na tarefa atual. Os resultados mostraram que é possível alcançar altos níveis de precisão e rememoração na classificação de textos narrativos e dissertativos. Os algoritmos obtiveram níveis de métricas semelhantes, demonstrando a qualidade das características extraídas.
O feedback é um fator muito importante no processo de ensino-aprendizagem e crucial na Educação a Distância, pois, como professores e alunos estão separados no espaço e/ou tempo, é através do feedback que o aluno vai entender como está o seu desempenho na disciplina e quais são os próximos passos do aprendizado. Existem na literatura modelos de feedback que ajudam o professor a estruturar e fornecer um feedback de qualidade ao aluno. Nesse trabalho utilizamos o conceituado modelo de feedback de Hattie e Timperley que divide o feedback em categorias (tarefa, processamento da tarefa, regulação e pessoal). É possível encontrar na literatura trabalhos que analisam feedback automaticamente com base nesse modelo. Contudo, esses trabalhos utilizam algoritmos tradicionais de aprendizagem de máquina e treinam classificadores binários para cada nível de feedback. Dessa forma, este trabalho tem como objetivo utilizar algoritmos de deep learning para classificação multi-classe de feedback com base no modelo de Hattie e Timperley.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.