El científico de datos trabaja y/o estudia un campo multidisciplinario e interdisciplinario. Forma parte de acciones (por lo general digitales) de funciones como: búsquedas en Internet, recomendación de compras, abastecimiento de comercios, rutas de entrega, análisis de sentimientos, etc. Está en todas partes. ¿Qué hace que un científico de datos encaje en la mayoría de las decisones humanas? Pues bien, la estadística es una de las disciplinas más importantes para los científicos de datos. Y hay algunos conceptos fundamentales que se usan de manera «automática» al analizar los datos. Veremos algunas de ellas a continuación.
- 1 Estado general del negocio a partir de un análisis rápido de los datos
- 2 Decisión sobre productos y/o sevicios – Diseño de experimentos
- 3 Creación de modelos que estimen un comportamiento o señal y no el ruido
- 4 Panorama general a través del análisis de grandes volúmenes de datos
- 5 Comprender la participación, la retención, la conversión y los clientes potenciales del negocio
- 6 Dar a los clientes lo que quieren
- 7 Estimación inteligente
- 8 Contar la historia con los datos
1 Estado general del negocio a partir de un análisis rápido de los datos
Estadísticas Utilizadas: Media, mediana, moda, varianza, etc.
El científico de datos puede hacer un análisis relativamente rápido del estado general del los datos que empezará a estudiar más a fondo. Pero al mismo tiempo tendrá un panorama general del comportamiento de variables, así como la intución (adquirida a través de la experiencia) de las posibles mejoras simples y rápidas que pueden implementarse de manera inmediata para la optimización de algún área del negocio.
2 Decisión sobre productos y/o sevicios – Diseño de experimentos
Estadísticas Utilizadas: Diseño de Experimentos, Estadísticas Frecuentistas (Pruebas de Hipótesis e Intervalos de Confianza)
El científico de datos puede ayudarnos a determinar si una diferencia es lo suficientemente significativa como para justificar una mayor atención, enfoque e inversión. Puede ayudarnos a comprender los resultados experimentales, esto es especialmente útil cuando estamos midiendo muchas métricas, ejecutando experimentos que se afectan entre sí, o tiene alguna paradoja de Simpson en sus resultados.
Por ejemplo, supongamos que un minorista nacional está tratando de probar el efecto de una nueva campaña de marketing. El científicos de datos nos ayuda a decidir qué tiendas debe asignar al grupo experimental tipos A-B para obtener un buen equilibrio entre los grupos experimental y de control, qué tamaño de muestra debe asignar al grupo experimental para obtener resultados claros y cómo ejecutar el gasto del estudio con el mínimo costo posible.
3 Creación de modelos que estimen un comportamiento o señal y no el ruido
Estadísticas utilizadas: regresión, clasificación, series de tiempo, etc.
El científico de datos puede estimar las razones del por qué las ventas han aumentado un cierto porcentaje. Además puede ayudarnos a comprender qué impulsa las ventas, cómo podrían ser las ventas el próximo mes y las posibles tendencias a las que debe prestar atención.
4 Panorama general a través del análisis de grandes volúmenes de datos
Estadísticas utilizadas: agrupamiento, reducción de dimensionalidad, análisis de variables latentes.
El científico de datos nos ayuda a etiquetar a cada cliente, agruparlos con clientes similares y comprender sus hábitos de compra. Esto permite ver cómo los desarrollos comerciales pueden afectar a ciertos grupos de la población, en lugar de mirar a todos como un todo o mirar a todos individualmente.
Por ejemplo, a partir de un análisis podemos dividir a los compradores de comestibles en grupos que incluyen compradores con un presupuesto limitado, enfocados en la familia, cuidando la cintura, derrochador y ahorrador.
5 Comprender la participación, la retención, la conversión y los clientes potenciales del negocio
Hay muchas preguntas que nos podemos hacer para potenciar las ventas, y al mismo tiempo, dar el mejor servicio a nuestros clientes, especialmente a los que son leales al negocio. Las preguntas pueden ser muy diversas, como por ejemplo:
¿Por qué sus clientes compran artículos de su sitio? ¿Cómo logras que tus clientes regresen? ¿Por qué los usuarios abandonan su embudo de ventas? ¿Cuándo saldrán después? ¿Qué tipo de correos electrónicos de la empresa atraen a los usuarios con más éxito? ¿Cuáles son algunos de los principales indicadores de compromiso, actividad o éxito? ¿Cuáles son algunas buenas oportunidades de venta?
6 Dar a los clientes lo que quieren
Estadísticas utilizadas: modelado predictivo, análisis de variables latentes, reducción de dimensionalidad, agrupamiento.
Dada una tabla de clientes y sus interacciones (clics, compras, calificaciones, etc) con los artículos de un negocio (anuncios, productos, películas), ¿puede sugerir qué artículos querrán sus usuarios a continuación?
7 Estimación inteligente
Estadísticas utilizadas: análisis de datos bayesianos
El científico de datos puede incorporar datos globales y conocimientos previos para obtener una estimación deseable, decirle las propiedades de esa estimación y resumir lo que significa la estimación.
8 Contar la historia con los datos
Estadísticas utilizadas: presentación y comunicación de datos, visualización de datos (no son precisamente conceptos de estadística, sino visualización de la aplicación de conceptos en los datos)
El papel del científico de datos en la empresa es servir como intermediarios entre los datos y la empresa. La comunicación es clave, y el científico de datos debe ser capaz de explicar sus conocimientos de manera que la empresa pueda participar, sin sacrificar la fidelidad de los datos.
El científico de datos no solo resume los números, sino que explica por qué los números son importantes y qué información procesable se puede obtener de ellos.
El científico de datos es el narrador de la empresa, comunica el significado de los datos y por qué son importantes para la empresa.