Ir a contenido


MENSAJE DE BIENVENIDA Foro vínculado con Twitter, más info aquí.

“El secreto para progresar es empezar por algún lugar. El secreto para empezar por algún lugar es fragmentar tus complejas y abrumadoras tareas de tal manera que queden convertidas en pequeñas tareas que puedas realizar y entonces simplemente comenzar por la primera.” - Mark Twain

Foto

Diferencia entre análisis OLAP y Minería de Datos


  • Please log in to reply
No replies to this topic

#1 Alberto Dominguez

Alberto Dominguez

    Gurú

  • Administradores
  • 1.059 Mensajes:
  • LocationMadrid

Escrito 01 abril 2010 - 22:01

Me parece interesante dejar por aquí una clara explicación a grandes rasgos de las diferencias entre estos dos tipos de análisis de datos:

El análisis que realizan las herramientas OLAP es dirigido por el usuario, son consultas lanzadas sobre cubos OLAP que tienen la información precalculada y almacenada. Por el contrario, la minería de datos permite razonar de forma inductiva a partir de lo que se llaman vistas "minables" de datos para llegar a una hipótesis general que modele el problema.

Un ejemplo clarificará la diferencia entre ambas técnicas:

Una pregunta típica de un sistema OLAP sería: “El año pasado, ¿se compraron más furgonetas en Cataluña o en Madrid?”. La respuesta del sistema a través de una consulta OLAP sería del tipo “En Cataluña se compraron 12.000 furgonetas, mientras que, durante el mismo intervalo, en Madrid se compraron 10.000”. Obviamente es una información interesante y útil, pero restringida por las hipótesis realizadas a priori.

En cambio, un problema típico para resolver utilizando minería de datos sería, por ejemplo: “Hallar un modelo que determine las características más relevantes de las personas que compran furgonetas”. Habría que construir una vista "minable" a partir de los datos del pasado que nos interese valorar como parametros de entrada, y el sistema de minería de datos proporcionaría una respuesta del tipo: “Depende de la época del año y la situación geográfica. En invierno, los habitantes de Madrid que pertenecen a un cierto grupo de edad y nivel de ingresos probablemente comprarán más furgonetas que gente de las mismas características en Cataluña”.

Como puede verse, se trata de problemas distintos, de modo que según los objetivos perseguidos deberá utilizarse una técnica u otra. Además, puesto que sus conclusiones son complementarias, en general será conveniente combinar ambas para obtener los mejores resultados.

Fuente: http://www.icons.es


Añadir que una consulta OLAP, por lo general, es devuelta en forma de tabla dinámica dónde en filas y columnas ves el nombre de alguno de los parámetros y en el centro ves los agregados de los mismos. Por ejemplo, en filas puedes poner los modelos de furgonetas y en columnas las ciudades, quedando en el centro la suma de las unidades vendidas para cada modelo y ciudad.

Imagen enviada
Ejemplo de Consulta OLAP


En la minería de datos los resultados se muestran de forma totalmente diferente y dependen del modelo aplicado a la vista o tabla minable. Tenéis más información de los modelos incluidos con SSAS (la solución de Microsoft para Datamining) aquí.

Imagen enviada
Ejemplo de resultado del Modelo de DataMining: Arboles de Decisión.


Saludos,

Alberto Dominguez

Enterprise Architect y Trainer
MCT, MCPD, MCITP, MCITP Dynamics, MCSE, MCSA, MCTS, MCP...
ITIL V3 Foundation Qualification in IT Service Management
Imagen enviadaPerfil Profesional Imagen enviadaTwitter
Imagen enviadaImagen enviadaImagen enviadaImagen enviada




0 usuarios están leyendo este tema

0 miembro/s, 0 invitado/s, 0 usuario/s anónimo/s