Corrección de datos imperfectos en bases de datos múltiples, anómalas, abiertas y públicas mediante aprendizaje automático

El propósito de la presente investigación, es el desarrollo teórico del análisis causal de las anomalías de los datos, teniendo en cuenta el gran volumen de datos que existen en la Administración Pública, especialmente en las administraciones tributarias, demostrando que los procesos metodológicos d...

Descripción completa

Detalles Bibliográficos
Autores principales: Sottile, Antonio, Cavaller, Daniel Guillermo, Sosa, Héctor Nicolás, Silva, Diego, Ortega Yubro, Cristian Darío, Azcurra, Norma Lidia
Formato: documento de conferencia
Lenguaje:Español
Publicado: 2018
Materias:
Acceso en línea:http://bdigital.uncu.edu.ar/11906
Descripción
Sumario:El propósito de la presente investigación, es el desarrollo teórico del análisis causal de las anomalías de los datos, teniendo en cuenta el gran volumen de datos que existen en la Administración Pública, especialmente en las administraciones tributarias, demostrando que los procesos metodológicos de la Minería de Datos y Aprendizaje Automático contribuyen a evidenciar indicios de ilícitos y hechos de corrupción, a través de la aplicación de algoritmos. Objetivos: • Detectar anomalías en los datos provenientes de bases de datos múltiples, y las inconsistencias de los datos no tradicionales, sean de origen interno y de origen externo a la organización, en este caso, una Administración Tributaria; • Analizar las causales de las anomalías y clasificarlas, segregando aquellas causales que manifiesten indicios de ilícitos y hechos de corrupción, del resto de las causales de las imperfecciones en los datos de las bases de datos múltiples y en los datos no tradicionales; • Corregir solamente las anomalías en los datos que puedan aseverarse que su causal de inconsistencia no responde a indicios de ilícitos y hechos de corrupción, para lograr la mayor calidad de los datos bajo análisis con el propósito de garantizar optimizar los modelos, en virtud de los objetivos planteados para la Minería de Datos; • Utilizar el conocimiento adquirido de la aplicación de los modelos, para inducirlo en los procesos metodológicos del Aprendizaje Automático, y redefinir los procesos y procedimientos de la organización de una Administración Tributaria, con los procesos metodológicos de la Minería de Procesos, como segunda instancia.