En Dataxplore también desarrollamos tecnología además de analizar datos. Powerhouse™ es nuestro producto de Data Mining creado a partir de nuestra Tecnología Powerhouse™.
Al proceso de explorar datos en busca de información útil y mediante modelos se lo llama Data Mining. El mismo consta de una serie de pasos tales como selección de los datos para trabajar, exploración, preparación y selección, de las variables, selección del algoritmo para crear el modelo, etc.
Si bien existen metodologías para guiar este proceso, gran parte del mismo es manual y requiere de un gran conocimiento del usuario de estas herramientas de Data Mining para finalizar un proyecto con éxito.
Por otro lado, la información encontrada en los datos será útil siempre y cuando se la coloque en el contexto del negocio, y esta tarea solamente la pueden hacer los que conocen su negocio.
Esta particularidad, un especialista para tratar con los datos y construir modelos por un lado y el que conoce el negocio por el otro, atenta contra el éxito del proyecto en varias formas:
- El especialista en construir modelos no siempre sabe qué es relevante y qué no.
- El que conoce del negocio debe pasar gran parte de su conocimiento al analista de datos, tarea que además de ser muy compleja, introduce retrasos muy importantes.
- Cierto tipo de modelos, como los de segmentación, necesitan de alguien que conozca el negocio para poder evaluarlos.
Éstos y otros problemas menos claros pero no menos importantes hacen que muchos proyectos de Data Mining terminen fracasando o con muy limitados resultados.
Con nuestra tecnología Powerhouse™ intentamos cambiar este paradigma mediante un enfoque totalmente novedoso para tratar con los datos.
Hemos desarrollado algoritmos (piezas básicas de análisis) inspirados en las ideas de Dorian Pyle que utilizó la Teoría de la Información de Shannon como base fundamental de análisis.
La clave está en la posibilidad de medir la información que contienen los datos. Antes de continuar, piense en lo siguiente: escuchamos y leemos por todos lados la importancia de la Información y cómo nos puede ayudar. Pero, ¿qué es la información? ¿cómo podemos medirla?
Sólo cuantificando esta información podremos conocer la efectividad de una etapa del tratamiento de los datos. Esta medición se convierte en la brújula que nos permitirá navegar en un mar de datos.