Métodos de reducción de dimensionalidad no lineales en tareas de aprendizaje automático : aplicaciones a datos de alta dimensionalidad
La capacidad de analizar bases de datos de alta dimensionalidad es de fundamental importancia en numerosas actividades productivas y áreas del conocimiento en general. Esto es particularmente cierto en la última década, ya que se observa un fuerte aumento en cantidad y la variedad de datos, facilita...
Autor principal: | |
---|---|
Otros Autores: | |
Formato: | info:eu-repo/semantics/other |
Lenguaje: | Español |
Publicado: |
2019
|
Materias: | |
Acceso en línea: | http://bdigital.uncu.edu.ar/14395 |
_version_ | 1782343174059982848 |
---|---|
author | Moyano, Luis Gregorio |
author2 | Rim, Daniela Noemí; Dinamarca, Agustina; Moyano, Nora Alejandra Elizabeth; Millán, Raúl Daniel; Ferrari Galizia, Ivan Emanuel; Rodríguez, María Cecilia ; Norte, Augusto; Planes, María Belén |
author_facet | Rim, Daniela Noemí; Dinamarca, Agustina; Moyano, Nora Alejandra Elizabeth; Millán, Raúl Daniel; Ferrari Galizia, Ivan Emanuel; Rodríguez, María Cecilia ; Norte, Augusto; Planes, María Belén Moyano, Luis Gregorio |
author_sort | Moyano, Luis Gregorio |
collection | Repositorio |
description | La capacidad de analizar bases de datos de alta dimensionalidad es de fundamental importancia en numerosas actividades productivas y áreas del conocimiento en general. Esto es particularmente cierto en la última década, ya que se observa un fuerte aumento en cantidad y la variedad de datos, facilitado por los últimos avances en hardware y software. Un área central en este crecimiento es el Aprendizaje Automático (AA), rama de las Ciencias de la Computación que estudia algoritmos que aprenden a ejecutar determinadas tareas a partir de ejemplos. Dentro del área de AA, es frecuente hacer uso de algoritmos de reducción de dimensionalidad sobre datos con gran cantidad de variables, con el foco en mejorar la capacidad de dichos algoritmos. En este plan de trabajo tenemos como objetivo general evaluar y cuantificar como diversos métodos de reducción de dimensionalidad impactan en el desempeño de tareas de AA. Para esto, haremos un estudio comparativo sobre cuatro casos de estudio empíricos que representan dos grandes tipos de datos: datos provenientes de simulaciones numéricas y datos relacionados con cohortes, por ejemplo de carácter demográfico o médico. Se compararán algoritmos de reducción de dimensionalidad, en particular no lineales, se identificarán cuales son más adecuados a cada tipo de datos y se cuantificará la mejora en el desempeño de tareas específicas de AA vinculadas a cada caso de estudio. |
format | info:eu-repo/semantics/other |
id | uncu-14395 |
institution | Biblioteca Digital - UNCUYO |
language | Español |
publishDate | 2019 |
record_format | ojs |
spelling | uncu-143952020-06-09T19:40:13Z Métodos de reducción de dimensionalidad no lineales en tareas de aprendizaje automático : aplicaciones a datos de alta dimensionalidad Nonlinear dimensionality reduction methods in machine learning tasks : applications to high-dimensional data Moyano, Luis Gregorio Análisis de datos Matemática apicada Enseñanza asistida por ordenador Enseñanza programada La capacidad de analizar bases de datos de alta dimensionalidad es de fundamental importancia en numerosas actividades productivas y áreas del conocimiento en general. Esto es particularmente cierto en la última década, ya que se observa un fuerte aumento en cantidad y la variedad de datos, facilitado por los últimos avances en hardware y software. Un área central en este crecimiento es el Aprendizaje Automático (AA), rama de las Ciencias de la Computación que estudia algoritmos que aprenden a ejecutar determinadas tareas a partir de ejemplos. Dentro del área de AA, es frecuente hacer uso de algoritmos de reducción de dimensionalidad sobre datos con gran cantidad de variables, con el foco en mejorar la capacidad de dichos algoritmos. En este plan de trabajo tenemos como objetivo general evaluar y cuantificar como diversos métodos de reducción de dimensionalidad impactan en el desempeño de tareas de AA. Para esto, haremos un estudio comparativo sobre cuatro casos de estudio empíricos que representan dos grandes tipos de datos: datos provenientes de simulaciones numéricas y datos relacionados con cohortes, por ejemplo de carácter demográfico o médico. Se compararán algoritmos de reducción de dimensionalidad, en particular no lineales, se identificarán cuales son más adecuados a cada tipo de datos y se cuantificará la mejora en el desempeño de tareas específicas de AA vinculadas a cada caso de estudio. The ability of analyzing high-dimensional databases is of fundamental importance in various productive activities and knowledge areas in general. This is particulary true in the last decade, where an important rise in quantity and variety of data is observed, fueled by the latest advances in hardware and software. A central area related to this growth is Machine Learning (ML), a branch of Computer Science that studies algorithms able to execute a set of tasks learning from examples. It is frequent in ML to make use of dimensionality reduction algorithms on high dimensionality data sets, with the aim of improving the performance of ML tasks. In this project, we have as main objective to evaluate and quantify how various dimensionality reduction methods impact in the performance of a set of ML tasks. For this, we will make a comparative study on four empirical case studies that represent two general type of data: data coming from numerical simulations, and cohort related data, e.g. demographic or medical data. We will compare dimensionality reduction algorithms, in particular non linear methods, we will identify which are more adequate for each type of data, and we will quantify performance improvement in specific ML tasks related to each case study. Rim, Daniela Noemí; Dinamarca, Agustina; Moyano, Nora Alejandra Elizabeth; Millán, Raúl Daniel; Ferrari Galizia, Ivan Emanuel; Rodríguez, María Cecilia ; Norte, Augusto; Planes, María Belén 2019-01-01 spa Mendoza 2019-2021 info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by/2.5/ar/ info:eu-repo/semantics/other info:ar-repo/semantics/proyecto de investigación info:eu-repo/semantics/acceptedVersion Creative Commons 2.5.ar application/pdf http://bdigital.uncu.edu.ar/14395 |
spellingShingle | Análisis de datos Matemática apicada Enseñanza asistida por ordenador Enseñanza programada Moyano, Luis Gregorio Métodos de reducción de dimensionalidad no lineales en tareas de aprendizaje automático : aplicaciones a datos de alta dimensionalidad |
title | Métodos de reducción de dimensionalidad no lineales en tareas de aprendizaje automático
: aplicaciones a datos de alta dimensionalidad |
title_full | Métodos de reducción de dimensionalidad no lineales en tareas de aprendizaje automático
: aplicaciones a datos de alta dimensionalidad |
title_fullStr | Métodos de reducción de dimensionalidad no lineales en tareas de aprendizaje automático
: aplicaciones a datos de alta dimensionalidad |
title_full_unstemmed | Métodos de reducción de dimensionalidad no lineales en tareas de aprendizaje automático
: aplicaciones a datos de alta dimensionalidad |
title_short | Métodos de reducción de dimensionalidad no lineales en tareas de aprendizaje automático
: aplicaciones a datos de alta dimensionalidad |
title_sort | métodos de reducción de dimensionalidad no lineales en tareas de aprendizaje automático
: aplicaciones a datos de alta dimensionalidad |
topic | Análisis de datos Matemática apicada Enseñanza asistida por ordenador Enseñanza programada |
url | http://bdigital.uncu.edu.ar/14395 |