Datos densos, el complemento ideal para los análisis Big Data

Los datos densos permiten tomar el pulso a los consumidores individuales con mayor precisión y ofrecen un análisis profundo sobre lo que hay detrás de los conjuntos de datos.

Fuente imagen: Imagen de Freepik

El modelo de smart city propone emplear los datos que se generan en un entorno urbano cada vez más sensorizado, con los generados por ciudadanos particulares que comparten información diversa gracias al despliegue del internet de las cosas, para generar indicadores que apoyen la toma de decisiones de las administraciones y las empresas que conviven en estas áreas metropolitanas. Sin embargo, la falta de información del contexto social en el que se generan este tipo de registros provoca que, en muchas situaciones, sea complicado interpretar los datos.

Esta información de contexto social se obtiene empleando técnicas cualitativas, que aportan información sobre las motivaciones o las intenciones de las personas para comportarse de determinada manera. Por tanto, la combinación de datos cuantitativos procedentes de registros de la actividad urbana, con datos cualitativos que esclarecen el porqué de los comportamientos humanos, parece postularse como la alternativa adecuada para explotar el potencial de modelos como el de smart city.

Es posible extrapolar esta misma reflexión a otro tipo de iniciativas sustentadas en amplios conjuntos de datos y en las que los usuarios son protagonistas como, por ejemplo, decisiones de consumo u otros hábitos sociales. Resulta crítico tener un control adecuado sobre cómo se originan y procesan los datos para que la información resultante sea válida y confiable; sin embargo, hay una percepción cada vez más extendida de que los datos por sí mismos, sin más, no son suficientes para entender la realidad de lo estudiado porque, por ejemplo, la ausencia de determinadas claves de estudio puede hacer que las personas –en el mejor de los casos– sean descritas de forma ligera o superficial. En efecto, los patrones o relaciones como los que emergen de análisis big data son identificados a menudo fuera de contexto, lo cual no solo les resta significado y valor, sino que también puede llevar a consecuencias indeseables a raíz de una toma de decisiones sesgada.

La carencia de información de contexto genera serios problemas en los resultados de proyectos big data. Para superar la poca información que los datasets revelan sobre el comportamiento de las personas, algunos investigadores proponen complementar los planteamientos big data con fuentes de datos densos o gruesos (thick data) ampliamente contextualizados. Estos datos densos podrían definirse como aquellos que facilitan la extracción de atributos cualitativos de las personas (necesidades, preferencias, motivaciones u otros insights) y que sirve para dar sentido a grandes volúmenes de información.

Los datos densos aportan significado al output de los procesamientos big data e informan de las historias que hay tras los valores y las conexiones entre los datos. Esta perspectiva combinada (bigthick) ofrece las ventajas de la escala, pero también gana en resolución (foco) y profundidad de análisis.

Se hace evidente la dificultad de modelar y cuantificar sistemas dinámicos como los que conciernen a las personas –en los que se entrelazan factores complejos e impredecibles y donde las condiciones cambian constantemente–, situación que se ve entorpecida, además, por la predisposición cuantitativa que mostramos los individuos y que nos hace que inconscientemente valoremos más lo que podemos medir que aquello que no es medible. También resulta paradójico comprobar cómo, en plena era del aprovechamiento de los datos masivos, es más necesario –si cabe– disponer de un mayor conocimiento cualitativo y granular, y con un enfoque local o “micro”. Así, por ejemplo, dar con los factores o elementos críticos que subyacen al feedback proporcionado por los clientes suele ser una tarea compleja, y difícilmente asumible a través de análisis de aprendizaje automático por lo limitado de la muestra ya que, de media, solo el 4% de clientes insatisfechos de un negocio cualquiera proporcionan comentarios acerca de su experiencia. Por otro lado, las aproximaciones big son muy útiles, por ejemplo, para caracterizar lo relacionado con el nivel de consumo o uso de un bien o servicio, sin embargo, se pierde el detalle de si es algo que estos consumidores quieren o desean plenamente o, simplemente, se conforman al no tener más alternativa. Se podría decir que lo medible no tiene por qué ser aquello que tiene valor, de ahí la necesidad de la investigación cualitativa y centrada en las personas.

Entre los beneficios de los datos densos destaca la posibilidad de (1) explorar los grupos de personas que se encuentran en los extremos o, incluso, fuera de los perfiles tipo, así como aquellos colectivos menos representados o marginales; (2) indagar sobre aquellos vacíos o contradicciones que aparecen entre lo que los usuarios dicen, hacen, piensan o aspiran/sueñan; (3) llegar a un nivel de desagregación tal para mostrar correspondencias de detalle sobre aquello que funciona en concreto para segmentos o agrupaciones reducidas consideradas individualmente; (4) tener pistas más claras de los múltiples puntos de encaje (positivos) y de fricción (negativos) que se producen en la experiencia o interacción con un producto/servicio, para su simple mejora o hasta su transformación integral.

En esta línea, la división de inteligencia artificial de la consultora tecnológica Cognizant ha sabido sacar partido de los datos densos para ofrecer soluciones inteligentes a sus clientes. Así, ante el problema de una de sus compañías cliente dedicada a la comercialización de tarjetas financieras a empresas que veía minorada sus ventas, se percataron de que era más importante implementar en sus herramientas comerciales la información relacionada con el gerente o propietario de estos negocios, en lugar de indicadores habituales como la facturación o el sector de actividad. Otra empresa cliente del sector energético tenía problemas con la satisfacción de sus usuarios, problema que fue abordado cambiando el enfoque para dirigirse al consumidor, pasando de comunicarse con ellos por los problemas de servicio que manifestaban a, más bien, conectar con sus metas o intereses en torno al servicio prestado.

Por su parte, los servicios de investigación aplicada y consultoría de Steelcase (empresa especializada en mobiliario de oficina y entornos laborales) también han sacado provecho de recursos de thick data para dar soporte en la realización de pruebas y prototipado de espacios de trabajo en empresas interesadas, con la finalidad de testar nuevas configuraciones, formas y comportamientos de desempeño laboral. En este sentido, los datos densos se focalizan en la extracción de claves relacionadas con la utilización, interacción y transición entre ambientes o zonas de trabajo por parte del personal.

Fuente imagen: Imagen de Freepik