Metrics proposal to measure the quality of governmental datasets

Authors

Keywords:

Best practices, Government, Open Access

Abstract

The government challenge is to provide citizens with information efficiently and transparently. In this context, the new challenges that arise can be considered as an opportunity to rethink the methodologies of designing and implementing public policies and promoting a State with collaborating public officials. All this leads to a new paradigm in the treatment of open and public information. Currently, data is an indispensable resource for any public management activity, so it is necessary to keep it updated and complete. Although it can be determined that more and more governments are embarking on this new concept of open data, there is still a long way to go. Several related works on this subject are increasingly focused on the quality of open data from the portals of government entities, but it is still necessary to reinforce and understand the importance of the data, that is, if a data has quality, it can be better used, manipulated and distributed to citizens for various purposes. This work focuses on the proposal of quality metrics to analyze the contents of published datasets and thus obtain an analysis to improve their dissemination and interoperability between databases and software.

Downloads

Download data is not yet available.

Author Biographies

Roxana Martínez, Universidad Abierta Interamericana (UAI)

Argentina, Ingeniera en Sistemas Informáticos (UAI-Universidad Abierta Interamericana). Doctorando en Ciencias Informáticas en la Universidad Nacional de La Plata (UNLP). Magíster en Tecnología Informática (UAI). Docente de posgrado en UAI. Docente de grado en UAI, UdeMM (Universidad de la Marina Mercante) y UNQ (Universidad Nacional de Quilmes). Contenidista en la Universidad Siglo 21. Investigadora en UAI. Es autora de artículos en congresos y revistas. Ha participado como tutora y jurado de tesis grado y posgrado, revisora en congresos nacionales. En el ámbito laboral, posee más de 18 años de experiencia en la rama de IT, actualmente se desempeña como Líder de Procesos IT en la UIF (Unidad de Información Financiera) de Argentina.

Rocío Andrea Rodríguez, Universidad Abierta Interamericana (UAI)

Argentina, Ingeniera en Informática (UNLaM - Universidad Nacional de La Matanza). Doctora en Ciencias Informáticas (UNLP - Universidad Nacional de La Plata). Docente de grado en UNLaM, UTN (Universidad Tecnológica Nacional) y UAI (Universidad Abierta Interamericana). Docente de posgrado en UAI. Desde el 2005 realiza investigación académica, actualmente es directora de proyectos en UAI). Tiene categoría 2 en el Programa de Incentivos al Docente investigador. Dirige tesis de grado, maestría y doctorado. Ha sido jurado en tribunales de tesis, revisora de artículos científicos en congresos y revistas. Autora de diversas publicaciones en congresos, revistas y libros.

Pablo Martín Vera, Universidad Abierta Interamericana (UAI)

Argentino, Ingeniero en Informática recibido en la Universidad Nacional de La Matanza (UNLaM). Obtuvo su título de Doctor en Ciencias Informáticas en la Universidad Nacional de La Plata (UNLP). Actualmente es docente de grado y postgrado en UNLaM, Universidad Tecnológica Nacional (UTN) y en la Universidad Abierta Interamericana (UAI). Adicionalmente a la docencia, se desarrolla como director de proyectos de investigación en UAI. Cuenta con más de 100 publicaciones académicas. Es revisor de trabajos científicos en diferentes congresos y revistas.

References

Arroyo Chacón, J. (2017), “La Innovación Abierta Como Pilar Del Gobierno Abierto”, Open Innovation as a Pillar of Open Government, Revista Enfoques, 15(27), 13-41.

Secretaría de Modernización. Presidencia de la Nación, “Paquete de Apertura de Datos de la República Argentina”, Disponible en: https://datosgobar.github.io/paquete-apertura-datos/guia-subnacionales/#1-que-son-los-datos-abiertos, consultado abril 2020.

Manfredi-Sánchez, J. L. (2017), “Horizontes de la información pública. El profesional de la información (EPI)”, 26(3), 353-360, Disponible en: http://www.elprofesionaldelainformacion.com/contenidos/2017/may/01.pdf

E. Oviedo, JN Mazón y JJ Zubcoff (2013), "Hacia un modelo de calidad de datos para portales de datos abiertos", XXXIX Latin American Computing Conference (CLEI) , Naiguata, 2013, pp. 1-8.

Montero, Gregorio (2017), “Del gobierno abierto al Estado abierto: la mirada del Centro Latinoamericano de Administración para el Desarrollo. Desde el gobierno abierto al Estado abierto en América Latina y el Caribe”, Santiago: CEPAL. LC/PUB. 2017/9-P. p. 53-81, 2017.

Ávila Barrios, D. (2014), “El uso de las TICs en el entorno de la nueva gestión pública mexicana”, Andamios, 11(24), 263-288.

Jiménez, C. E., Criado, J. I., & Gascó, M. (2011). Technological e-government interoperability. an analysis of iberoamerican countries. IEEE Latin America Transactions, 9(7), 1112-1117.

Penteado, B., Carlos, M. J., & Isotani, S. (2021). Process model with quality control for the production of high quality linked open government data. IEEE Latin America Transactions, 19(3), 421-429.

Ramírez-Alujas, Á. V. (2010). Innovación en la gestión pública y open government (gobierno abierto): Una vieja nueva idea (Innovation in Public Management and Open Government: An Old New Idea). Revista Buen Gobierno, (9).

Rodríguez, J. A. M. (2019), “Valoración de factores de uso de los datos abiertos de gobierno”, Instituto de Ciencias de Gobierno y Desarrollo Estratégico (Doctoral Dissertation, Benemérita Universidad Autónoma De Puebla), Disponible en: https://www.researchgate.net/profile/Ricardo_Tovar/publication/331966039_Valoracion_de_factores_de_uso_de_los_datos_abiertos_de_gobierno/links/5c958a14299bf11169409c0c/Valoracion-de-factores-de-uso-de-los-datos-abiertos-de-gobierno.pdf , consultado en mayo 2020.

Vicente-Paños, A., & Jordán-Alfonso, A. (2017), “Acceso A La Información Pública Y Su Reutilización En Las Comunidades Autónomas: Evaluación De La Reutilización De Datos Abiertos”, El profesional de la información, 26(3).

Ariza Amado, D. F., & Rojas Clavijo, J. A. (2019), “Prototipo de Software para la evaluación de principios de datos abiertos”. Universidad Católica De Colombia, Facultad De Ingeniería, Programa De Ingeniería De Sistema, Trabajo De Investigación Tecnológica, Bogotá D.C., Colombia.

OECD Better policities for better lives, “Open Government Data”, Disponible en: http://www.oecd.org/internet/digital-government/open-government-data.htm, consultado en junio 2020.

Melo, C. A. H., & Sanabria, J. S. G. (2020), “Proposal for the Evaluation of Open Data Portals”, Facultad de Ingeniería, 29(54), 1-20.

Zainal, N. Z., Hussin, H., & Nazri, M. N. M. (2019), “Acceptance, Quality and Trust Factors–Conceptual Model for Open Government Data Potential Use”, International Journal on Perceptive and Cognitive Computing, 5(2), 12-18.

Open Data Barometer – World Wide Web Foundation, “The Open Data Barometer”, Disponible es: https://opendatabarometer.org/?_year=2017&indicator=ODB, consultado en marzo 2020.

Máchová, R., Hub, M., & Lnenicka, M. (2018), “Usability evaluation of open data portals”, Aslib Journal of Information Management.

Oviedo Blanco, E. (2016), “Modelo de madurez para portales de datos abiertos e incorporación a la norma técnica nacional de Costa Rica”, Repositorio Institucional de la Universidad de Alicante, Tesis Doctoral, Disponible en: http://rua.ua.es/dspace/handle/10045/54316, consultado en abril 2020.

Beltrán, L., Estefan, N., & Mahecha Moyano, J. F. (2017), “Prototipo de software para la evaluación de la calidad de datos abiertos”, Tesis de grado, Repositorio Institucional de la Universidad Católica de Colombia, Disponible en: https://repository.ucatolica.edu.co/jspui/bitstream/10983/14642/1/Data%20Quality%20in%20OpenData.pdf, consultado en mayo 2020.

Ibanez Gonzalez, L., Millard, I., Glaser, H., & Simperl, E. (2019), “An assessment of adoption and quality of linked data in European open government data”.

Rodríguez Rojas, L. A. (2017), “Metamodelo para integración de datos abiertos aplicado a inteligencia de negocios”, Tesis de Doctoral, Repositorio Institucional de la Universidad de Oviedo, Disponible en: http://digibuo.uniovi.es/dspace/handle/10651/44552, consultado en mayo 2020.

Arizo, I. (2016), “Métricas basadas en datos”, Tesis de Maestría en Gestión de la Información, Universitat Politècnica de València.

Abella, A., Ortiz-de-Urbina-Criado, M., & De-Pablos-Heredero, C. (2018), “Indicadores de calidad de datos abiertos: el caso del portal de datos abiertos de Barcelona”, El profesional de la información (EPI), 27(2), 375-382.

Cadena-Vela, S. (2019), “Marco de referencia para la publicación de datos abiertos comprensibles basado en estándares de calidad”, Tesis doctoral en Ciencias Informáticas, Universidad de Alicante.

ISO 25012 (2008), “Ingeniería de software - Requisitos de calidad y evaluación de productos de software (SQuaRE) - Modelo de calidad de datos”, Disponible en: https://www.iso.org/obp/ui/es/#iso:std:iso-iec:25012:ed-1:v1:en, consultado en enero 2021

Graph Everywhere (2021), “Principales indicadores para Calidad de Datos”, Disponible en: https://www.grapheverywhere.com/principales-indicadores-para-calidad-de-datos/, consultado en enero 2021

datos.gob.ar (2021), “Estándares según el tipo de Datos”, Disponible en: https://datosgobar.github.io/paquete-apertura-datos/guia_abiertos/#estandares-segun-el-tipo-de-datos, consultado en enero 2021

W3C (2015), “Modelo para datos tabulares y metadatos en la Web”, Disponible en: https://www.w3.org/TR/tabular-data-model/, consultado en enero 2021.

Roxana Martínez, Rocío Rodríguez, Pablo Vera (2020), “Análisis de datasets y catálogos en los portales abiertos gubernamentales de la República Argentina”, IEEE ARGENCON 2020. V Biennial Congress of IEEE Argentina Section, In virtual mode, December 1 to December 4, 2020.

Beltrán Martínez, B. (2014), “Minería de datos”, Benemérita Universidad Autónoma de Puebla, Facultad de Ciencias de la Computación.

Gobernarte Ideas innovadoras para mejores gobiernos (2017), “Análisis predictivo: Impulsar mejoras mediante el uso de datos”, Disponible en: https://blogs.iadb.org/administracion-publica/es/analisis-predictivo-impulsar-mejoras-mediante-uso-datos/, consultado en enero 2021

Gómez, C. E. J., & Roma, J. C. (2018), “Análisis predictivo de datos abiertos sobre el uso turístico del servicio de alquiler compartido de bicicletas de Nueva York”, Universidad Oberta de Catalunya, Master Universitario en Ciencia de Datos.

Marotta, A., Vallespir, D., & Valverde, C. (2012), “Análisis de la calidad de datos en experimentos en ingeniería de software”, In XVIII Congreso Argentino de Ciencias de la Computación.

Méndez Matamoros, J. H. (2017), “Mejoramiento de calidad en conjuntos de datos abiertos basado en la aplicación de métricas de consistencia lógica”, Tesis de Maestría en Ciencias de la Información y las Comunicaciones.

Alba Cuellar, D. (2011), “Detección de registros duplicados entre dos archivos digitales”, Disponible en:

https://cimat.repositorioinstitucional.mx/jspui/bitstream/1008/239/2/TE%20370.pdf, consultado en enero 2021.

Buenos Aires DATA (2021), “Historias con Datos”, Ciudad de Buenos Aires, Disponible en: https://data.buenosaires.gob.ar/historias-con-datos, consultado en marzo 2021

Datos.gob.ar (2021), “Valores nulos, desconocidos o en blanco en campos numéricos”, Disponible en: https://datosgobar.github.io/paquete-apertura-datos/guia_abiertos/#valores-nulos-desconocidos-o-en-blanco-en-campos-numericos, consultado en enero 2021

Datos.gob.ar (2021), “Celdas vacías en filas para agrupar conceptos”, Disponible en: https://datosgobar.github.io/paquete-apertura-datos/guia_abiertos/#celdas-vacias-en-filas-para-agrupar-conceptos, consultado en enero 2021

Argentina unida, “Datos Argentina”, Disponible en: https://datos.gob.ar/, consultado marzo 2020.

Perfil de Aplicación Nacional de Metadatos para Datos Abiertos, Secretaría de Modernización, Presidencia de la Nación, “Perfil de Aplicación Nacional de Metadatos para Datos Abiertos”, Disponible en: https://datosgobar.github.io/paquete-apertura-datos/perfil-metadatos/#condiciones-de-cumplimiento-del-perfil, consultado marzo 2020.

Datos.gob.ar (2021), “Guía para la identificación y uso de entidades interoperables”, Paquete de Apertura de Datos de la República Argentina, Disponible en: https://datosgobar.github.io/paquete-apertura-datos/guia-interoperables/#guia-para-la-identificacion-y-uso-de-entidades-interoperables, consultado en enero 2021

Datos.gob.ar (2021), “¿Porqué es importante estandarizarlos”, Disponible en: https://datosgobar.github.io/paquete-apertura-datos/guia-interoperables/#por-que-es-importante-estandarizarlos, consultado en enero 2021

Cai, L., & Zhu, Y. (2015), “The challenges of data quality and data quality assessment in the big data era”, Data science journal, 14.

Conformated Dimensions of Data Quality (2018), “Annual Survey about Use of Dimensions of Data Quality”, Disponible en:

http://dimensionsofdataquality.com/dims_survey, consultado en febrero 2021.

Datos Argentina – Paquete-apertura-datos (2017), “Guía para el uso y la publicación de metadatos”, Disponible en: https://paquete-apertura-datos.readthedocs.io/es/0.2.3/guia_metadatos.html, consultado en marzo 2021.

Datos.gob.ar (2021), “CSV”, Guía para la publicación de datos en formatos abiertos, Disponible en: https://datosgobar.github.io/paquete-apertura-datos/guia_abiertos/#csv, consultado en enero 2021

Published

2021-09-13

How to Cite

Martínez, R., Rodríguez, R. A., & Vera, P. M. (2021). Metrics proposal to measure the quality of governmental datasets. IEEE Latin America Transactions, 20(2), 301–308. Retrieved from https://latamt.ieeer9.org/index.php/transactions/article/view/5642