“…A detecc ¸ão transtorno depressivo com base em dados textuais (e.g., provenientes de redes sociais ou outras fontes) é tipicamente modelada na forma de um problema de aprendizado de máquina supervisionado, ou seja, fazendo uso de córpus de textos rotuladas com informac ¸ões relativas ao estado de saúde mental de seus autores (e.g., usuários de redes sociais) para treino e teste de classificadores. Sob esta perspectiva, a tarefa pode ser vista como uma instância do problema de caracterizac ¸ão autoral [dos Santos et al 2020b, Flores et al 2022] combinado à detecc ¸ão de linguagem afetiva [da Silva et al 2020]. Um levantamento de estudos recentes deste tipo é apresentado na Tabela 1, com indicac ¸ão do gênero de texto considerado (Reddit, Twitter), a forma de representac ¸ão dos dados textuais (b=bag of words, BERT [Devlin et al 2019], d=características de domínio, e=embeddings, h=horário da publicac ¸ão, i=imagens, l=atributos LIWC [Pennebaker et al 2001], m=metadados, n=informac ¸ões de rede, p=part-of-speech, s=atributos afetivos, t=tópicos, u=informac ¸ões demográficas), e métodos computacionais (e.g., CNN=redes neurais convolucionais, LSTM=long short-term neural networks, LR=regressão logística, RF=Random Forest, etc.…”