Minería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima






descargar 97.84 Kb.
títuloMinería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima
página1/2
fecha de publicación14.08.2015
tamaño97.84 Kb.
tipoDocumentos
e.exam-10.com > Finanzas > Documentos
  1   2

Proyectos de Ingeniería de Sistemas II – Minería de Datos



Facultad de Ingeniería Industrial y de Sistemas

Carrera Profesional de Ingeniería de Sistemas


Minería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima.

PROYECTO DE TESIS
Presentada por: Hober Willy Siccha Vega
Asesorado por: Ing. Pedro Chávez Farfán
Lima – Perú

2012

INDICE DE CONTENIDO


INTRODUCCION 5
CAPITULO I: ASPECTOS GENERALES 7
1.1 Definición del problema 7

1.2 Definición de los objetivos 8

1.3 Justificación del Proyecto 8

1.4 Alcance del Proyecto 9
CAPITULO II: MINERIA DE DATOS 10


    1. Inteligencia de Negocios 10

2.1.1 ¿Qué es Business Intelligence? 10

2.1.2Componentes de Business Intelligence? 10

    1. Conocimiento en Base de Datos 11

2.2.1 Descubrimiento de Conocimiento en Base de Datos (KDD) 11

2.2.2Concepto del KDD 11

2.2.3El proceso de KDD 12

    1. Minería de Datos (Data Mining) 14

2.3.1 Definición de Minería de Datos 14

2.3.2 Principales características y objetivos de la Minería de Datos 14

2.3.3 Fases de un Proyecto de Minería de Datos 15

2.3.4 Técnicas de Minería de Datos 16

2.3.5 Aplicaciones de Minería de Datos 17

    1. Plataforma Microsoft SQL Server (Minería de Datos) 20

2.4.1 Microsoft SQL Server 20

2.4.2 Características de Microsoft SQL Server 20

    1. Metodología de Validación del Modelo (Microsoft SQL Server) 21

2.5.1 Probar la exactitud con gráficos de mejora respecto al modelo predictivo 21

2.5.2 Probar un modelo filtrado 24
REFERENCIAS 25

INDICE DE ILUSTRACIONES

FIGURA Nro.1: Jerarquía del Conocimiento 12
FIGURA Nro. 2: Proceso de KDD 13
FIGURA Nro. 3: Fases del Proyecto de M.D. 16


INDICE DE GRAFICOS

GRAFICO Nro.1: Gráfico de elevación de minería de datos 23
GRAFICO Nro. 2: Gráfico de beneficios de minería de datos 24
GRAFICO Nro. 3: Gráfico de dispersión de minería de datos 25


Introducción
El desarrollo tecnológico al que hemos llegado, el aumento desbordante del número de consumidores, la capacidad de compra del consumidor, la enorme demanda de productos, la diversidad de productos en el mercado, la gran cantidad de servicios que se ofrecen en todos los giros comerciales, la gran variedad de perfiles del consumidor moderno, la cada vez mayor exigencia del cliente que demanda nuevos productos de mayor calidad, más funcionales, con mayor capacidad de resolución, con mayor capacidad de respuesta y a mejor precio, por todo esto y más en la actualidad se están creando grandes montañas de datos, bases de datos de enorme tamaño, millones de datos que se han estado almacenando o que siguen almacenándose, cada día los cerros de información en forma de datos numéricos, han planteado a los investigadores y analistas de datos nuevos retos para el manejo de los mismos y de su análisis para luego extraer de ellos conocimiento, sobre todo de la fuente que los generó, el consumidor.

Los mineros entran a las entrañas de la tierra, en las montañas se abren camino entre las rocas, tierra, arcilla, lodo, en busca de la esencia, el metal precioso hasta que encuentran la

veta de oro y plata de entre las toneladas de escombro, piedra y lodo, y extraen el material realmente valioso.

De la misma manera, el analista entra a las montañas de datos en búsqueda de la esencia de la información sobre las variables del problema. A diario se generan grandes cantidades de datos dando lugar a inmensas bases de datos, que en su interior contienen información muy valiosa, esencial para el descubrimiento del conocimiento que permita tomar decisiones sobre el presente y futuro de las organizaciones.

Con la enormidad de las montañas de datos que actualmente se generan, ya no solo es viable el uso de las técnicas estadísticas tradicionales para su análisis y búsqueda de fundamentos como: probar hipótesis, el muestreo, la teoría de límite central, la teoría de la estimación, la regresión, el análisis de varianza, el diseño de experimentos.

Las cantidades de información en la actualidad son tan enormes que es prácticamente imposible su asimilación por una sola persona, por lo que se hace necesario contar con nuevos métodos de procesamiento de datos, nuevas tecnologías que nos permitan y nos faciliten el proceso de búsqueda del conocimiento escondido al interior de las enormes montañas de datos existentes y que nos proporcionen la esencia contenida en la base de datos.

El interés de esta investigación es determinar el comportamiento a futuro y la naturaleza de los datos históricos de ventas con tarjeta de crédito en las tiendas de Saga Falabella de la ciudad de Lima a través de la explotación de las técnicas de minería de datos, con la finalidad de ayudar a los miembros de la alta dirección a analizar los hábitos de los clientes a fin de satisfacer mejor su demanda, mejorar la administración de los inventarios de los productos que están asociados a las transacciones de ventas y mejorar los volúmenes de ventas.

CAPITULO I: ASPECTOS GENERALES
1.1 Definición del Problema

1.1.1 Descripción del Problema

Saga Falabella es una de las empresas más grandes de Perú y forma parte del Grupo Falabella que agrupa las cadenas de tiendas por departamentos más importantes de Sudamérica, con presencia en Perú, Chile, Argentina y Colombia. (5)

Falabella desarrolla su actividad comercial a través de varias áreas de negocio, las principales son las tiendas por departamento. (5) Es así que las ventas de Saga Falabella en el Perú para el año 2011 logró cifras de 1,488.5 millones de nuevos soles, siendo el 65% del total de las ventas mediante la tarjeta de crédito. (2,4)

En los últimos años, los datos grabados de la empresa Saga Falabella en la base de datos han ido incrementándose considerablemente. Esta información, de gran importancia estratégica para la empresa Saga Falabella, se accede a través del uso de técnicas clásicas como son sentencias SQL y los procedimientos almacenados. Por tal motivo existe demora en la recuperación y el análisis de la información para la elaboración de informes, formularios y reportes de gestión solicitados por la alta dirección.

Así es necesaria la utilización de métodos analíticos más avanzados, como es la minería de datos para la explotación de datos con la finalidad de ayudar a los miembros de la alta dirección a la toma de decisiones.

1.1.2 Formulación del Problema

¿Cuál es el comportamiento en el futuro y la naturaleza de las operaciones con tarjeta de crédito en las tiendas de Saga Falabella de la ciudad de Lima?

1.2 Definición de los Objetivos

1.2.1 Objetivo General

Determinar el comportamiento a futuro y la naturaleza de los datos históricos de ventas con tarjeta de crédito de Saga Falabella de la ciudad de Lima, a través de las técnicas de minería de datos.
1.2.2 Objetivos Específicos

  • Diseñar la plataforma de minería de datos para el proceso de transacciones de compras de tarjeta de crédito de Saga Falabella.

  • Diseñar el modelo de datos que se usará para la plataforma de minería de datos.

  • Diseñar las técnicas de validaciones que permitan comprobar la calidad de las predicciones encontradas en el presente trabajo.


1.3 Justificación del Proyecto

Debido a que los volúmenes de operaciones de ventas con tarjeta de crédito han crecido consistentemente y representan actualmente el 65% del total de las ventas de Saga Falabella. (2,4)La empresa cuenta con técnicas clásicas de análisis de datos, originando demora en la recuperación y el análisis de la información solicitados por los miembros de la alta dirección.
El presente proyecto es importante porque permitirá determinar el comportamiento a futuro y la naturaleza de los datos históricos de ventas realizadas con tarjeta de crédito de Saga Falabella en la ciudad de Lima, utilizando técnicas de minería de datos. Con la finalidad de ayudar a los miembros de la alta dirección a analizar los hábitos de los clientes a fin de satisfacer mejor su demanda, mejorar la administración de los inventarios de los productos que están asociados a las transacciones de ventas y mejorar los volúmenes de ventas realizados con la tarjeta de crédito en las tiendas de Saga Falabella de la ciudad de Lima.
1.4 Alcance del Proyecto

El presente trabajo abarca el estudio de las transacciones en el área de tarjeta de crédito de Saga Falabella basado en las técnicas de minería de datos. Las transacciones a contemplar son las de compras de los consumidores realizadas con tarjeta de crédito en las tiendas retail de Saga Falabella en la ciudad de Lima.

CAPITULO II: MINERIA DE DATOS
2.1 Inteligencia de Negocios

Algo peor que no tener información disponible es tener mucha información y no saber qué hacer con ella. La Inteligencia de Negocios o Business Intelligence (BI) es la solución a ese problema, pues por medio de dicha información puede generar escenarios, pronósticos y reportes que apoyen a la toma de decisiones, lo que se traduce en una ventaja competitiva. La clave para BI es la información y uno de sus mayores beneficios es la posibilidad de utilizarla en la toma de decisiones. En la actualidad hay una gran variedad de software de BI con aplicaciones similares que pueden ser utilizados en las diferentes áreas de la empresa, tales como, ventas, marketing, finanzas, etc. Son muchas las empresas que se han beneficiado por la implementación de un sistema de BI, además se pronostica que con el tiempo se convertirá en una necesidad de toda empresa. (7)
2.1.1 ¿Qué es Business Intelligence?

La Inteligencia de Negocios o Business Intelligence (BI) se puede definir como el proceso de analizar los bienes o datos acumulados en la empresa y extraer una cierta inteligencia o conocimiento de ellos. Dentro de la categoría de bienes se incluyen las bases de datos de clientes, información de la cadena de suministro, ventas personales y cualquier actividad de marketing o fuente de información relevante para la empresa. (7)

BI apoya a los tomadores de decisiones con la información correcta, en el momento y lugar correcto, lo que les permite tomar mejores decisiones de negocios. La información adecuada en el lugar y momento adecuado incrementa efectividad de cualquier empresa. (7)
2.1.2 Componentes de Business Intelligence

Todas las soluciones de BI tienen funciones parecidas, pero deben de reunir al menos los siguientes componentes:

• Multidimensionalidad: La información multidimensional se puede encontrar en hojas de cálculo, bases de datos, etc. Una herramienta de BI debe de ser capaz de reunir información dispersa en toda la empresa e incluso en diferentes fuentes para así proporcionar a los departamentos la accesibilidad, poder y flexibilidad que necesitan para analizar la información. (7)

• Data Mining: Las empresas suelen generar grandes cantidades de información sobre sus procesos productivos, desempeño operacional, mercados y clientes. Pero el éxito de los negocios depende por lo general de la habilidad para ver nuevas tendencias o cambios en las tendencias. Las aplicaciones de data mining pueden identificar tendencias y comportamientos, no sólo para extraer información, sino también para descubrir las relaciones en bases de datos que pueden identificar comportamientos que no son muy evidentes. (7)

• Agentes: Los agentes son programas que piensan. Ellos pueden realizar tareas a un nivel muy básico sin necesidad de intervención humana. Por ejemplo, un agente pueden realizar tareas un poco complejas, como elaborar documentos, establecer diagramas de flujo, etc. (7)

• Data Warehouse: Es la respuesta de la tecnología de información a la descentralización en la toma de decisiones. Coloca información de todas las áreas funcionales de la organización en manos de quien toma las decisiones. También proporciona herramientas para búsqueda y análisis. (7)

2.2 Conocimiento en Bases de Datos

2.2.1 Descubrimiento de Conocimiento en Bases de Datos (KDD)

En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos, debido básicamente al gran poder de procesamiento de las máquinas como a su bajo costo de almacenamiento. Sin embargo, dentro de estas enormes masas de datos existe una gran cantidad de información oculta, de gran importancia estratégica, a la que no se puede acceder por las técnicas clásicas de recuperación de la información. El descubrimiento de esta información oculta es posible gracias a la Minería de Datos (DataMining), que entre otras sofisticadas técnicas aplica la inteligencia artificial para encontrar patrones y relaciones dentro de los datos permitiendo la creación de modelos, es decir, representaciones abstractas de la realidad, pero es el descubrimiento del conocimiento (KDD, por sus siglas en inglés) que se encarga de la preparación de los datos y la interpretación de los resultados obtenidos, los cuales dan un significado a estos patrones encontrados.

Así el valor real de los datos reside en la información que se puede extraer de ellos, información que ayude a tomar decisiones o mejorar nuestra comprensión de los fenómenos que nos rodean. Hoy, más que nunca, los métodos analíticos avanzados son el arma secreta de muchos negocios exitosos. Empleando métodos analíticos avanzados para la explotación de datos, los negocios incrementan sus ganancias, maximizan la eficiencia operativa, reducen costos y mejoran la satisfacción del cliente. (7)
2.2.2 Concepto del KDD

De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación de la información y ese modelo representen un valor agregado, entonces nos referimos al conocimiento. En la figura 1 se ilustra la jerarquía que existe en una base de datos entre datos, información y conocimiento. Se observa igualmente el volumen que presenta en cada nivel y el valor que los responsables de las decisiones le dan en esa jerarquía. El área interna dentro del triángulo representa los objetivos que se han propuesto. La separación del triángulo representa la estrecha unión entre dato e información, no así entre la información y el conocimiento. (7)

Figura Nro. 1: Jerarquía del Conocimiento.

Fuente: Vallejos, 2006. Minería de Datos
El objetivo fundamental del KDD es encontrar conocimiento útil, válido, relevante y nuevo sobre un fenómeno o actividad mediante algoritmos eficientes, dadas las crecientes órdenes de magnitud en los datos. (7)
2.2.3 El proceso de KDD

El proceso de KDD consiste en usar métodos de minería de datos (algoritmos) para extraer (identificar) lo que se considera como conocimiento de acuerdo a la especificación de ciertos parámetros usando una base de datos junto con pre-procesamientos y post-procesamientos. En la figura 2 se ilustra el proceso de KDD. (7)

Figura Nro. 2: Proceso de KDD

Fuente: Vallejos, 2006. Minería de Datos
El proceso de descubrimiento de conocimiento en bases de datos involucra varios pasos:

  1. Determinar las fuentes de información: que pueden ser útiles y dónde conseguirlas.

  2. Diseñar el esquema de un almacén de datos (Data Warehouse): que consiga unificar de manera operativa toda la información recogida.

  3. Implantación del almacén de datos: que permita la navegación y visualización previa de sus datos, para discernir qué aspectos puede interesar que sean estudiados. Esta es la etapa que puede llegar a consumir el mayor tiempo.

  4. Selección, limpieza y transformación de los datos que se van a analizar: la selección incluye tanto una criba o fusión horizontal (filas) como vertical (atributos). La limpieza y pre-procesamiento de datos se logra diseñando una estrategia adecuada para manejar ruido, valores incompletos, secuencias de tiempo, casos extremos (si es necesario), etc.

  5. Seleccionar y aplicar el método de minería de datos apropiado: esto incluye la selección de la tarea de descubrimiento a realizar, por ejemplo, clasificación, agrupamiento o clustering, regresión, etc. La selección de él o de los algoritmos a utilizar. La transformación de los datos al formato requerido por el algoritmo específico de minería de datos. Y llevar a cabo el proceso de minería de datos, se buscan patrones que puedan expresarse como un modelo o simplemente que expresen dependencias de los datos, el modelo encontrado depende de su función (clasificación) y de su forma de representarlo (árboles de decisión, reglas, etc.), que especificar un criterio de preferencia para seleccionar un dentro de un conjunto posible de modelos, se tiene que especificar estrategia de búsqueda a utilizar (normalmente está predeterminada el algoritmo de minería).

  6. Evaluación, interpretación, transformación y representación de patrones extraídos: Interpretar los resultados y posiblemente regresar a los pasos anteriores. Esto puede involucrar repetir el proceso, quizás con otros datos, otros algoritmos, otras metas y otras estrategias. Este es un paso crucial que se requiere tener conocimiento del dominio. La interpretación puede beneficiarse procesos de visualización, y sirve también para borrar patrones redundantes o irrelevantes.

  7. Difusión y uso del nuevo conocimiento: Incorporar el conocimiento descubierto al sistema (normalmente mejorarlo) lo cual puede incluir resolver conflictos potenciales con el conocimiento existente. El conocimiento se obtiene para realizar acciones, ya sea incorporándolo dentro de un sistema de desempeño o simplemente para almacenarlo y reportarlo a las personas interesadas. En este sentido, KDD implica un proceso interactivo e iterativo involucrando la aplicación de varios algoritmos de minería de datos. (7)



2.3 Minería de Datos (Data Mining)

2.3.1 Definición de Minería de Datos

La minería de datos es un conjunto de herramientas y técnicas de análisis de datos que por medio de la identificación de patrones extrae información interesante, novedosa y potencialmente útil de grandes bases de datos que puede ser utilizada como soporte para la toma de decisiones. Una gran parte de estas técnicas son una combinación directa de madurez en tecnología de bases de datos y data warehousing, con técnicas de aprendizaje automático y de estadística.

Para descubrir conocimiento de la información se pueden utilizar varias formas de análisis por medio de las cuales se puede llegar a identificar patrones y reglas en los datos para luego crear escenarios, esta información se puede representar por medio de modelos matemáticos sobre datos históricos y con esto se crea un modelo de minería de datos. Después de haber creado un modelo de minería de datos, se puede examinar nueva información a través del modelo evaluando si se apega a los patrones o reglas definidos. (3)
2.3.2 Principales características y objetivos de la Minería de Datos

  • Explorar los datos que se encuentran en las profundidades de las bases de datos, como los almacenes de datos, que algunas veces contienen información almacenada durante varios años. En algunos casos, los datos se consolidan en un almacén de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet.

  • Las herramientas de la minería de datos ayudan a extraer el mineral de la información enterrado en archivos corporativos o en registros públicos, archivados. El minero es, muchas veces un usuario final con poca o ninguna habilidad de programación, facultado por barrenadoras de datos y otras poderosas herramientas indagatorias para efectuar preguntas específicas y obtener rápidamente respuestas. Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e inesperados.

  • Las herramientas de la minería de datos se combinan fácilmente y pueden analizarse y procesarse rápidamente. Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en paralelo para la minería de datos.

  • La minería de datos produce cinco tipos de información: asociaciones, secuencias, clasificaciones, agrupamientos y pronósticos. (7)


2.3.3 Fases de un Proyecto de Minería de Datos

En la figura 3 se ilustra las Fases del Proyecto de MD, los pasos a seguir para la realización de un proyecto de minería de datos son siempre los mismos, independientemente de la técnica específica de extracción de conocimiento usada. (7)
Figura Nro. 3: Fases del Proyecto de M.D.

Fuente: Vallejos, 2006. Minería de Datos
El proceso de minería de datos pasa por las siguientes fases:


  • Filtrado de datos:

El formato de los datos contenidos en la fuente de datos (base de datos, Data Warehouse) nunca es el idóneo, y la mayoría de las veces no es posible ni siquiera utilizar ningún algoritmo de minería sobre los datos en bruto.

Mediante el preprocesado, se filtran los datos (de forma que se eliminan valores incorrectos, no válidos, desconocidos, según las necesidades y el algoritmo a usar), se obtienen muestras de los mismos (en busca de una mayor velocidad de respuesta del proceso), o se reducen el número de valores posibles (mediante redondeo, clustering entre otros). (7)


  • Selección de Variables:

Aún después de haber sido pre-procesados, en la mayoría de los casos se tiene una cantidad ingente de datos. La selección de características reduce el tamaño de los datos eligiendo las variables más influyentes en el problema, sin apenas sacrificar la calidad del modelo de conocimiento obtenido del proceso de minería.

Los métodos para la selección de características son básicamente dos:

• Aquellos basados en la elección de los mejores atributos del problema,

• Y aquellos que buscan variables independientes mediante test de sensibilidad, algoritmos de distancia o heurísticos. (7)


  • Extracción de Conocimiento:

Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. También pueden usarse varias técnicas a la vez para generar distintos modelos, aunque generalmente cada técnica obliga a un pre-procesado diferente de los datos. (7)


  • Interpretación y Evaluación:

Una vez obtenido el modelo, se debe proceder a su validación, comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos. (7)
2.3.5 Técnicas de la Minería de Datos

En general, cualquiera que sea el problema a resolver, no existe una única técnica para solucionarlo, sino que puede ser abordado siguiendo aproximaciones distintas. El número de técnicas es muy grande y solo puede crecer en el futuro. La siguiente es una lista de técnicas: (1)
2.3.5.1 Análisis Factoriales Descriptivos. Permiten hacer visualizaciones de realidades multivariantes complejas y, por ende, manifestar las regularidades estadísticas, así como eventuales discrepancias respecto de aquella y sugerir hipótesis de explicación. (1)
2.3.5.2 «MarketBasketAnalysis» o análisis de la cesta de la compra. Permite detectar que productos se adquieren conjuntamente, permite incorporar variables técnicas que ayudan en la interpretación, como el día de la semana, localización, forma de pago. También puede aplicarse en contextos diferentes del de las grandes superficies, en particular el e-comercio, e incorporar el factor temporal. (1)
2.3.5.3 Técnicas de «clustering». Son técnicas que parten de una medida de proximidad entre individuos y a partir de ahí, buscar los grupos de individuos más parecidos entre sí, según una serie de variables mesuradas. (1)
2.3.5.4 Series Temporales. A partir de la serie de comportamiento histórica, permite modelizar los componentes básicos de la serie, tendencia, ciclo y estacionalidad y así poder hacer predicciones para el futuro, tales como cifra de ventas, previsión de consumo de un producto o servicio, etc. (1)
2.3.5.5 Redes bayesianas. Consiste en representar todos los posibles sucesos en que estamos interesados mediante un grafo de probabilidades condicionales de transición entre sucesos. Puede codificarse a partir del conocimiento de un experto o puede ser inferido a partir de los datos. Permite establecer relaciones causales y efectuar predicciones. (1)
2.3.5.6 Modelos Lineales Generalizados. Son modelos que permiten tratar diferentes tipos de variables de respuesta, por ejemplo la preferencia entre productos concurrentes en el mercado. Al mismo tiempo, los modelos estadísticos se enriquecen cada vez más y se hacen más flexibles y adaptativos, permitiendo abordar problemas cada vez más complejos: GAM, ProjectionPursuit, PLS, MARS. (1)
2.3.5.7 Previsión local. La idea de base es que individuos parecidos tendrán comportamientos similares respecto de una cierta variable de respuesta. La técnica consiste en situar los individuos en un espacio euclídeo y hacer predicciones de su comportamiento a partir del comportamiento observado en sus vecinos. (1)
2.3.5.8 Redes neuronales. Inspiradas en el modelo biológico, son generalizaciones de modelos estadísticos clásicos. Su novedad radica en el aprendizaje secuencial, el hecho de utilizar transformaciones de las variables originales para la predicción y la no linealidad del modelo. Permite aprender en contextos difíciles, sin precisar la formulación de un modelo concreto. Su principal inconveniente es que para el usuario son una caja negra. (1)

2.3.5.9 Árboles de decisión. Permiten obtener de forma visual las reglas de decisión bajo las cuales operan los consumidores, a partir de datos históricos almacenados. Su principal ventaja es la facilidad de interpretación. (1)
2.3.5.10 Algoritmos genéticos. También aquí se simula el modelo biológico de la evolución de las especies, sólo que a una velocidad infinitamente mayor. Es una técnica muy prometedora. En principio cualquier problema que se plantee, como la optimización de una combinación entre distintas componentes, estando estas componentes sujetas a restricciones, puede resolverse mediante algoritmos genéticos. (1)
Un enriquecimiento de las posibilidades de análisis son los sistemas híbridos, esto es, la combinación de dos o más técnicas para mejorar la eficiencia en la resolución de un problema, como por ejemplo, utilizar un algoritmo genético para inicializar una red neuronal, o bien utilizar un árbol decisión como variable de entrada en una regresión logística. (1)
2.3.6 Aplicaciones de Minería de Datos

La minería de datos es cada vez más popular debido a la contribución substancial que puede hacer. Puede ser usada para controlar costos así como también para contribuir a incrementar las entradas. (3)

Muchas organizaciones están usando minería de datos para ayudar a manejar todas las fases del ciclo vital del cliente, incluyendo la adquisición de nuevos clientes, aumentando los ingresos con clientes existentes y manteniendo bien a la clientela.

Determinando características de clientes buenos (trazado de perfil), una compañía puede determinar conjuntos con características similares. Perfilando clientes que hayan comprado un producto en particular, ello puede enfocar la atención en clientes similares que no hayan comprado ese producto (de venta cruzada). (3)

Cerca de perfilar clientes que se han ido, lo que la compañía hace para retener los clientes que están en riesgo de alejarse, porque es normalmente un poco menos caro retener un cliente que conseguir uno nuevo. (3)

Las ofertas de minería de datos se valoran a través de una amplia efectividad de industrias. Las compañías de telecomunicaciones y tarjeta de crédito son dos de los conductores para aplicar minería de datos, para detectar el uso fraudulento de sus servicios. (3)

Compañías aseguradoras y bolsas de valores se interesan también al aplicar esta tecnología para reducir el fraude.

Las aplicaciones médicas son otra área fructífera; la minería de datos se puede utilizar para predecir la eficiencia de procedimientos quirúrgicos, las pruebas médicas o medicaciones. (3)

Las compañías activas en el mercado financiero, usan minería de datos para determinar el mercado y características de industria así como para predecir el comportamiento de las compañías individuales y mejorar el sistema de inventarios. Los minoristas están haciendo mayor uso de la minería de datos, para decidir que productos en particular deben mantener en inventario para no abastecerse de productos innecesarios, así como para evaluar la eficacia de promociones y ofertas. Las firmas farmacéuticas poseen grandes bases de datos de los compuestos químicos y de material genético en las cuales hay substancias que pueden muy buenas ser candidatas para minar, esto con el objetivo de determinar cómo se pueden desarrollar nuevos agentes para los tratamientos de determinadas enfermedades. (3)

2.4 Plataforma Microsoft SQL Server
2.4.1 Microsoft SQL Server (9)

Microsoft SQL Server ofrece un entorno integrado para crear modelos de minería de datos y trabajar con ellos. La solución SQL Server Data Mining permite el acceso a la información necesaria para tomar decisiones inteligentes sobre problemas empresariales complejos.
Microsoft SQL Server permite implementar el resto de funcionalidades de un sistema de Business Intelligence:

- Data Warehouse: los datos se pueden almacenar en tablas relacionales de SQL Server o generar bases de datos multidimensionales (cubos OLAP).

- ETL: DTS (Data Transformation Services) permite extraer datos de diversos orígenes, manipularlos, y almacenarlos en SQL Server.

- Base de datos multidimensional y servidor OLAP: SQL Server puede guardar datos en bases de datos multidimensionales utilizando los servicios de SQL Server Analysis Services, implementando a su vez el servidor OLAP asociado.

- Data Mining: El mismo servicio de Analysis Services también ofrece la posibilidad de aplicar algoritmos de Data Mining.

- Generación de informes: Reporting Services, la más importante novedad de la plataforma SQL Server 2000, que se puede descargar del sitio de Microsoft.

- Alertas: SQL Server Notification Services es otro módulo adicional que se puede descargar del sitio de Microsoft para desarrollar aplicaciones de envío de alertas.

- Otras opciones: aunque por el momento no estén pensadas para hacer la competencia a otras herramientas mejores de otros fabricantes, existen complementos basados en Office y en Sharepoint Portal Services como clientes de bases de datos multidimensionales.
2.4.2. Características de Microsoft SQL Server

- El procesamiento de los modelos de una misma estructura de minería ocurre en paralelo, en una sola lectura de los datos.

- Suministra más de 12 visores de resultados para los algoritmos que ayudarán a comprender mejor los patrones encontrados en el proceso de minería.

- Proporciona gráficos de elevación, de beneficios y una matriz de clasificación que permite establecer una comparación de lo real con lo previsto; para contrastar y comparar la calidad de los modelos.

- Posee un lenguaje para la creación de consultas de minería (DMX) similar al SQL que facilita la tarea de creación de aplicaciones de minería de datos. Posee una interfaz gráfica para generar las consultas DMX.

- Cuenta con los algoritmos de minería más avanzados: Naive Bayes, Clustering, Clústeres de Secuencia, Árboles de Decisión, Redes Neuronales, Series Temporales, Reglas de Asociación, Regresión Logística, y Regresión Lineal y minería de textos.

2.5 Metodología de Validación del Modelo de Minería de Datos (Microsoft SQL Server) (8)
La validación es el proceso de evaluar cuál sería el rendimiento de sus modelos de minería de datos con datos reales. Es importante que se valide los modelos de minería de datos entendiendo su calidad y sus características antes de implementarlos en un entorno de producción.

Existen muchos enfoques a la hora de evaluar la calidad y las características de un modelo de minería de datos.

  • Usar varias medidas de validez estadística para determinar si existen problemas en los datos o en el modelo.

  • Separar los datos en conjuntos de entrenamiento y de prueba con el fin de probar la precisión de predicciones.

  • Solicitar a los expertos comerciales que revisen los resultados del modelo de minería de datos para determinar si los patrones detectados tienen sentido en un escenario empresarial concreto.

Todos estos métodos son útiles para la metodología de minería de datos y se usan de forma iterativa a la hora de crear, probar y refinar modelos para responder a un problema concreto. No hay ninguna regla completa única que pueda indicarle si un modelo es suficientemente bueno, o si cuenta con suficientes datos.
Analysis Services proporciona diversos métodos para determinar la precisión de los modelos de minería de datos. El proceso de validación se realiza con las tareas siguientes:
2.5.1Probar la exactitud con gráficos de mejora respecto al modelo predictivo
  1   2

Añadir el documento a tu blog o sitio web

similar:

Minería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima icon2011 impuesto sobre las ventas minoristas de determinados hidrocarburos 9
«ventas minoristas» las efectuadas en los establecimientos que cuenten con instalaciones fijas para la venta al público para consumo...

Minería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima iconCursos del doctorado realizados con las siguientes calificaciones

Minería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima iconPor dar como resultado; calco del inglés “to result in”. No está la acepción en drae ni en da
«Pague con tarjeta de crédito para que la ley federal lo proteja si tiene que disputar los cargos.»

Minería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima iconLas ventas de arte en china caen un 24 por ciento al tiempo que estados...
El mercado chino del arte empezó a sufrir una desaceleración por primera vez en tres años con una caída de las ventas agregadas de...

Minería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima iconIdentificación fiscal en las operaciones con entidades de crédito,...
«Utilización del número de identificación fiscal en operaciones con trascendencia tributaria», y en el apartado 7 del artículo 28,...

Minería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima iconEl punto 2 de tarjeta de crédito no lo voy a dictar por falta de tiempo ver en contratos

Minería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima iconTema 16. La compraventa mercantil; concepto y régimen jurídico. El...

Minería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima iconEl total de las ventas de productos del campo en el exterior ya supera las de café

Minería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima iconBase de datos con información de las entidades fiscalizadoras superiores

Minería de Datos aplicados a las ventas con Tarjeta de Crédito realizados en las tiendas Saga Falabella en la ciudad de Lima iconLa situación de la minería en Guatemala es grave. Hay tres puntos...




Economía


© 2015
contactos
e.exam-10.com