Convolutional Neural Networks and Long Short-Term Memory Networks for Textual Classification of Information Access Requests

Eduardo Paiva; Andréa  Paim; Nelson Ebecken

Authors

Eduardo Paiva Universidade Federal do Rio de Janeiro https://orcid.org/0000-0001-5265-3511
Andréa Paim Universidade Federal do Rio de Janeiro https://orcid.org/0000-0002-0012-5490
Nelson Ebecken Universidade Federal do Rio de Janeiro https://orcid.org/0000-0003-4928-0966

Keywords:

Convolution Neural Network, Long Short-Term Memory, Government Data, Text Classification

Abstract

The e-sic system aims to centralize requests for access to information addressed to the Brazilian Federal Executive. However, the volume of requests received can be an impediment to responses to those requests. The purpose of this article is to create an automatic classifier for these requests. For that, they were analyzed as architectures of the Convolutional Neural Network (CNN) and of Long Short Term Memory (LSTM), as well as a combination of these two architectures in order to identify the best architectures to this problem. The metrics used to evaluate the results were the area under curve roc and accuracy, and the error function used was cross entropy. The study concluded that the CNN network performed the best. Thus, the main contribution of this article is the identification of the most appropriate network architecture for classifying texts of interaction between citizens and government written in Portuguese.

Downloads

Download data is not yet available.

Author Biographies

Eduardo Paiva, Universidade Federal do Rio de Janeiro

Possui graduação em Engenharia da Computação pelo Instituto Militar de Engenharia (2003) e Mestrado em Informática pela Universidade Federal do Estado do Rio de Janeiro (2017). Aluno de doutorado do Programa de Programa de Engenharia Civil, na área de Sistemas Computacionais, da COPPE - Universidade Federal do Rio de Janeiro. http://lattes.cnpq.br/7688846833775668.

Andréa Paim , Universidade Federal do Rio de Janeiro

graduada em Estatística pela Escola Nacional de Ciências e Estatística (1993), mestre em Estudos Populacionais e Pesquisas Sociais pela Escola Nacional de Ciências Estatísticas (2007). Atualmente é aluna de doutorado do Programa de Engenharia Civil, na área de Sistemas Computacionais, da COPPE - Universidade Federal do Rio de Janeiro. http://lattes.cnpq.br/7794414876694859.

Nelson Ebecken , Universidade Federal do Rio de Janeiro

possui doutorado em Engenharia Civil pela Universidade Federal do Rio de Janeiro (1977). Atualmente é Professor titular da Universidade Federal do Rio de Janeiro. Publicou 135 artigos em periódicos especializados e 361 trabalhos em anais de eventos. Possui 19 livros publicados. Orientou 135 dissertações de mestrado e 138 teses de doutorado nas áreas de Ciência da Computação, Engenharia Civil e Ciência da Informação. Atua em áreas interdisciplinares da Engenharia e Engenharia de Petróleo, com ênfase em Sistemas Computacionais. As principais áreas de interesse são: Data Mining, Estruturas Offshore, Redes Neurais, Análise Não-Linear, Métodos Computacionais e Método dos Elementos Finitos. http://lattes.cnpq.br/2703716951709834.

Convolutional Neural Networks and Long Short-Term Memory Networks for Textual Classification of Information Access Requests

Authors

Keywords:

Abstract

Downloads

Author Biographies

Eduardo Paiva, Universidade Federal do Rio de Janeiro

Andréa Paim , Universidade Federal do Rio de Janeiro

Nelson Ebecken , Universidade Federal do Rio de Janeiro

Downloads

Published

How to Cite

Issue

Section

Make a Submission

Information