analytics

  • El uso del análisis de datos trae resultados impactantes a los equipos de fútbol, que ahora ven a la analítica como una ficha clave en la toma de decisiones.

    En los últimos años, la tecnología se ha convertido en el director técnico de los equipos deportivos, pues resulta ser un factor clave no solo para identificar problemas que tienen los equipos en los encuentros deportivos, sino también para hacer un completo estudio de la situación de cada jugador y así poder establecer la estrategia de juego más adecuada.

    Es por esto que la analítica se ha convertido en una oportunidad para obtener información relevante de manera que las selecciones de fútbol puedan hacer análisis predictivos del accionar de los jugadores durante un encuentro deportivo, anticipar los problemas de salud y prevenir lesiones de los integrantes del equipo, crear estrategias para ganar los partidos, e incluso definir qué jugadores estarán en el campo de juego en determinado momento.

    El análisis de datos como estrategia para fidelizar

    Para nadie es un secreto que mucho más allá de ser un deporte, el fútbol es un gran negocio que necesita de herramientas como la analítica para crecer y mantenerse firme en el mercado. Por eso, actualmente existen soluciones comoSports Analytics, que son capaces de medir la cantidad de entradas vendidas por evento, la hora, forma y lugar en que fueron compradas, además de calcular el tiempo que tomó vender todas las entradas a un partido, desde el momento en que salieron a la venta.

    Lo anterior es de gran utilidad para los clubes de fútbol, porque de esa forma pueden crear estrategias para fidelizar a sus seguidores. Por ejemplo tenemos el caso de la Liga Mayor de Fútbol (MLS) que implementó las soluciones de SAS para poder comprender a su afición, medir la lealtad de sus seguidores y aumentar el Retorno de Inversión (ROI) en sus estrategias de negocio.

    Sin duda, las campañas diseñadas con visión analítica ayudan a los equipos de fútbol a captar nuevos fans y a fidelizar a sus clientes actuales.

    El papel de la analítica en los fichajes

    Otro uso efectivo de la analítica en el campo de los deportes está relacionado con los fichajes. Como les comentamos arriba,actualmente el fútbol no solo es un deporte, sino que también es una industria, por lo que su rentabilidad no se puede dejar a la suerte.

    Para este tema en particular, el análisis de datos juega un papel importante pues permite conocer parámetros descriptivos del jugador (como el número de goles, asistencias, robos, etc.) y con esta información comparar datos con otros jugadores similares para tomar la decisión más apropiada.

    La analítica, un factor clave para la toma de decisiones

    Tal y como ocurre en la mayoría de empresas donde los gerentes se apoyan del análisis de datos para la toma de decisiones, en los equipos de fútbol los dirigentes ahora acuden a la analítica para crear estrategias ganadoras y para seguir impulsando al fútbol como una gran industria.

    Eso sí, aunque la analítica pueda ser de gran utilidad para los equipos de fútbol, este deporte seguirá siendo impredecible en cierta medida, por lo que seguirán existiendo errores, goles de último minuto e incluso, lesiones inesperadas. Es justamente por esa razón que el análisis de datos juega un papel importante a la hora de ayudar a prevenir dichas situaciones fortuitas.

     

  • Los científicos de datos y los ingenieros de datos pueden ser nuevos títulos de trabajo, pero los roles de trabajo centrales han existido por un tiempo. Tradicionalmente, cualquier persona que analice datos se llamaría "analista de datos" y cualquier persona que crea plataformas de respaldo para respaldar el análisis de datos sería un "Desarrollador de inteligencia empresarial (BI)".

    Con la aparición de Big Data, comenzaron a aparecer nuevos roles en corporaciones y centros de investigación como científicos de datos e ingenieros de datos.

    Aquí hay una descripción general de las funciones del analista de datos, desarrollador de BI, científico de datos e ingeniero de datos.

    Analista de datos

    Los analistas de datos son profesionales de datos con experiencia en su organización que pueden consultar y procesar datos, proporcionar informes, resumir y visualizar datos. Tienen un sólido conocimiento de cómo aprovechar las herramientas y los métodos existentes para resolver un problema, y ​​ayudan a las personas de toda la empresa a comprender consultas específicas con informes y cuadros específicos. Sin embargo, no se espera que traten con el análisis de grandes datos, ni se espera que tengan los antecedentes matemáticos o de investigación para desarrollar nuevos algoritmos para problemas específicos.

    Habilidades: los analistas de datos deben tener una comprensión básica de algunas habilidades básicas: estadísticas, recopilación de datos, visualización de datos, análisis exploratorio de datos,

    Herramientas: Microsoft Excel, SPSS, SPSS Modeler, SAS, SAS Miner, SQL, Microsoft Access, Tableau, SSAS .

     

    Desarrolladores de inteligencia de negocios

    Los desarrolladores de inteligencia empresarial son expertos en datos que interactúan más estrechamente con las partes interesadas internas para comprender las necesidades de informes y luego recopilar requisitos, diseñar y crear soluciones de BI e informes para la empresa. Deben diseñar, desarrollar y dar soporte a almacenes de datos, paquetes ETL, cubos, paneles de control e informes analíticos nuevos y existentes. Además, trabajan con bases de datos, tanto relacionales como multidimensionales, y deben tener excelentes habilidades de desarrollo de SQL para integrar datos de diferentes recursos. Utilizan todas estas habilidades para satisfacer las necesidades de autoservicio de toda la empresa. Normalmente no se espera que los desarrolladores de BI realicen análisis de datos.

    Habilidades: ETL, elaborar reportes, OLAP, cubos, web intelligence, business objects design,
    Herramientas: Tableau, dashboard tools, SQL, SSAS, SSIS, SPSS Modeler.

     difference between data scientist and data engineer img 2

    Ingeniero de datos

    Los Ingenieros de datos son los profesionales de datos que preparan la infraestructura de "big data" para ser analizados por los científicos de datos. Son ingenieros de software que diseñan, construyen, integran datos de diversos recursos y administran big data. Luego, escriben consultas complejas sobre eso, se aseguran de que sea fácilmente accesible, que funcione sin problemas y que su objetivo sea optimizar el rendimiento del gran ecosistema de datos de su empresa.
    También pueden ejecutar algunos ETL (Extraer, Transformar y Cargar) sobre grandes conjuntos de datos y crear grandes almacenes de datos que pueden ser utilizados para informes o análisis por científicos de datos. Más allá de eso, dado que los Ingenieros de datos se centran más en el diseño y la arquitectura, generalmente no se espera que conozcan ningún aprendizaje automático o análisis de big data.

    Habilidades: Hadoop, MapReduce, Hive, Pig, Data streaming, NoSQL, SQL, programación.
    Herramientas: DashDB, MySQL, MongoDB, Cassandra

     

    Científico de datos

    Un científico de datos es el alquimista del siglo XXI, alguien que puede convertir datos sin procesar en ideas purificadas. Los científicos de datos aplican estadísticas, aprendizaje automático y enfoques analíticos para resolver problemas empresariales críticos. Su función principal es ayudar a las organizaciones a convertir sus volúmenes de big data en información valiosa y útil.
    De hecho, la ciencia de la información no es necesariamente un campo nuevo en sí, pero puede considerarse como un nivel avanzado de análisis de datos que está impulsado y automatizado por el aprendizaje automático y la informática. En otra palabra, en comparación con los "analistas de datos", además de las habilidades analíticas de datos, se espera que los científicos de datos tengan una gran capacidad de programación, una capacidad para diseñar nuevos algoritmos, manejar grandes volúmenes de datos, con cierta experiencia en el conocimiento del dominio.

    Además, también se espera que los científicos de datos interpreten y entreguen con elocuencia los resultados de sus hallazgos, mediante técnicas de visualización, aplicaciones de ciencia de datos de construcción o narrando historias interesantes sobre las soluciones a sus problemas de datos (negocios).
    Las habilidades de resolución de problemas de un científico de datos requieren una comprensión de los métodos de análisis de datos tradicionales y nuevos para construir modelos estadísticos o descubrir patrones en los datos. Por ejemplo, crear un motor de recomendación, predecir el mercado de valores, diagnosticar a los pacientes según su similitud o encontrar patrones de transacciones fraudulentas.
    Los científicos de datos a veces pueden presentar grandes datos sin tener en cuenta un problema empresarial en particular. En este caso, se espera que el científico de datos curioso explore los datos, formule las preguntas correctas y proporcione hallazgos interesantes. Esto es complicado porque, para analizar los datos, un científico de datos sólido debe tener un conocimiento muy amplio de las diferentes técnicas en el aprendizaje automático, la minería de datos, las estadísticas y las infraestructuras de big data.

    Deben tener experiencia trabajando con diferentes conjuntos de datos de diferentes tamaños y formas, y ser capaces de ejecutar sus algoritmos en datos de gran tamaño de manera efectiva y eficiente, lo que normalmente significa mantenerse actualizado con las últimas tecnologías de vanguardia. Por esta razón, es esencial conocer los fundamentos y la programación de la informática, incluida la experiencia con lenguajes y tecnologías de bases de datos (grandes / pequeñas).

    Habilidades: Python, R, Scala, Apache Spark, Hadoop, machine learning, deep learning, estadistica.
    Herramientas: Data Science Experience, Jupyter, RStudio.

     

    Data Engineer vs Data Scientist vs Data Analyst

     

    Fuente: https://cognitiveclass.ai/blog/data-scientist-vs-data-engineer/

  • ESTRATEGIA:

    1. Soñando que la analítica es una varita mágica plug & play que traerá un retorno de la inversión a muy corto plazo. Los modelos básicos de Excel bien ejecutados pueden haber traído ganancias rápidas en la década de 2000, pero los análisis avanzados requieren algo de tiempo. 

    La analítica nunca es plug & play porque la conexión de datos en modelos es extremadamente larga, porque los aprendizajes no son transferibles entre empresas o mercados y porque requieren un alto OPEX en personas y un alto CAPEX en sistemas.

    2. Resolver problemas que no merecen ser resueltos, lo que resulta en una pérdida de tiempo y recursos. El análisis no se trata de soluciones que buscan problemas, sino de problemas que buscan soluciones. 

    Preguntas como "¿Qué podemos hacer con la cadena de bloqueo? "Cómo puedo resolver mi problema de marketing" es una pregunta que tiene sentido. El peor error del Jefe de Análisis de Datos es no tener una visión extremadamente clara de los principales retos y oportunidades a los que se enfrenta cada área funcional.


    3. Confiar únicamente en proveedores o consultores para el análisis, especialmente en la creación de modelos. La autopsia de cómo las empresas fallan en el desarrollo de capacidades con consultores es la siguiente: el cliente contrata a un consultor para que entregue un proyecto y, al mismo tiempo, desarrolle capacidades internas. 

    El cliente tiene expectativas demasiado poco realistas sobre el impacto del proyecto y los consultores nunca dicen "No" y sobrevenden el proyecto. El impacto no se materializa y un día el cliente le dice al consultor: "Si no obtienes algún impacto en el próximo mes, detendré tu contrato". Ese día, el desarrollo de capacidades muere oficialmente, si es que hubiera existido. RIP. Unos cuantos millones de dólares en el cubo de la basura. De todos modos, la analítica es el cerebro de la empresa. Trabajar con proveedores y consultores puede funcionar, pero hay que pensar bien la gobernanza.

    4. No elaborar una lista completa de prioridades. Dado que sólo se puede contar con cinco dedos en una mano, por lo tanto, la gerencia debe escoger un máximo de cinco métricas en lugar de hacer que todo parezca importante.

    5. Decir sí a peticiones aleatorias o accesorias, como proyectos de visualizaciones y reportes glamourosos que a menudo resultan en el síndrome de análisis-parálisis.


    6. Asumiendo que no pagar por datos externos o subir a la nube es la solución para la privacidad y seguridad de los datos. Si bien existen algunas restricciones regulatorias en algunos sectores y países, y a veces incluso límites éticos, la monetización externa y la nube realizada correctamente no implican necesariamente riesgos de seguridad.


    GENTE:

    7. Organizar el análisis bajo áreas que no impulsan el negocio a diario, como la TI o la estrategia. La analítica sólo es poderosa si se combina organizativamente con las operaciones diarias. Debe ser organizado por negocio, no IT o Estrategia

    8. Permitir que múltiples equipos de análisis florezcan con silos organizacionales entre ellos. Analytics necesita mantener una visión integrada del negocio.

    9. Atraer el talento sólo a través de la compensación base. En cambio, es necesario construir un sentido de propósito, crear una poderosa marca de empleador y desarrollar el talento interno.

    10. Contratar a un grupo de doctores que se esfuerzan por desarrollar modelos altamente complejos en lugar de soluciones rudimentarias direccionalmente correctas, por lo que no logran demostrar una visión procesable. Por lo tanto, contrate a estudiantes rápidos altamente entrenables (incluso si tienen un doctorado) .

    11. Contratación de un Director Técnico de Análisis de Datos no técnico o viceversa. Necesita ser lo suficientemente técnico como para entrenar a su equipo y lo suficientemente orientado al negocio como para entender los problemas del negocio.

    12. No traer expertos en dominios y consultores de negocio internos a los equipos de análisis para cerrar la brecha entre los líderes de negocio y los equipos de análisis para asegurar un viaje de punta a punta de idea a impacto.

    13. Descuidar la creación de una cultura basada en datos a través del coaching activo en toda la organización, desde los agentes de ventas hasta el CEO, especialmente los agentes de ventas y el CEO.

    14. No ser lo suficientemente objetivo y permanecer sesgado hacia el statu quo o el pensamiento de liderazgo. Los equipos de análisis profundamente integrados en las funciones de negocio o BUs son más propensos a tener estos problemas que los centralizados. Es por eso que algunas organizaciones crean equipos de control de calidad.



    EJECUCIÓN:

    15. No integrar la analítica en los modelos operativos y en los flujos de trabajo diarios. El uso de la analítica como parte de sus actividades diarias ayuda a los usuarios a tomar decisiones mejor informadas, a incorporar la retroalimentación de los consumidores en las soluciones y a iterar rápidamente nuevos productos; en cambio, muchos siguen confiando en los instintos.

    16. No se trata de juntar por juntar a los científicos de datos con los equipos de negocios. De lo contrario, no se hablarán entre ellos.

    17. Gestión de proyectos analíticos en cascada. Los parámetros de un modelo no se pueden conocer de antemano. Se determinan a través de un proceso iterativo que se parece más a un arte que a una ciencia. Por lo tanto, los proyectos analíticos deben ser iterativos siguiendo, por ejemplo, el Agile Framework.

    18. No ser capaz de escalar los pilotos de análisis. Las compañías a menudo terminan matando los pilotos tan pronto como necesitan reasignar fondos para otras iniciativas a corto plazo.

    19. Descuidar la gobernanza de los datos como un elemento fundamental. El gobierno de datos se refiere a la organización, los procesos y los sistemas que una organización necesita para gestionar sus datos de forma adecuada y coherente como un activo, desde la gestión de la calidad de los datos hasta el control de acceso o la definición de la arquitectura de los datos de forma estandarizada.




    TECNOLOGÍA:

    20. Intentar crear modelos de ciencia de datos sin refinar su infraestructura de ingeniería de datos: repositorios limpios, motores eficientes y procesos optimizados de transferencia de carga de extracción. La ingeniería de datos sin casos de uso reales para modelar también está mal. Tanto la modelización como la ingeniería deben ir en paralelo o de forma iterativa.

    21. No utilizar ninguna de las siguientes tecnologías básicas: Hadoop, Spark, R, Python, una herramienta de visualización avanzada de su elección, y un sistema de informes granular de autoservicio abierto para toda la organización.

    22. Disponer de silos tecnológicos entre los repositorios de datos, lo que dificulta la integración de diferentes tipos de datos en un modelo. El poder de la analítica aumenta exponencialmente con la diversidad de los datos.

    23. No automatizar la analítica a través de la I.A., que puede ser un asistente extremadamente inteligente para los científicos de datos. Las automatizaciones de I.A. ayudan a los científicos a limpiar los datos, a comprobar su exactitud, a desplegar modelos, a detectar características de predicción relevantes y la obsolescencia de los modelos, o incluso a generar cientos o miles de variaciones de modelos. 
    Con todo, la estrategia analítica del negocio tiene que ser un subconjunto de toda la estrategia de I.A. ya que los conjuntos de datos necesitan alimentar los sistemas de I.A.


    FINANZAS:

    24. No asignar suficiente presupuesto para las plataformas de análisis, pero aún así mantener las expectativas del sueño de Shangri-La. Y lo contrario es también un error, al asignar más que suficiente dinero que no tiene correlación directa con los resultados de las empresas.

    25. No medir el ROI de las iniciativas de análisis. Sabemos que el ROI es a medio plazo, pero eso no significa que no lo mida.



    Visto en Datasciencentral