La Ciencia de datos es un campo interdisciplinario que involucra los procesos y sistemas para extraer conocimiento o un mejor entendimiento de grandes volúmenes de datos en sus diferentes formas (estructurados o no estructurados) y formatos (.txt, .dat, .doc, .jpg, etcétera).
Cuando se trata de la construcción de un equipo de ciencia de datos, las empresas deben esperar encontrar trabajadores de una variedad de antecedentes, en lugar de esperar un unicornio.
Para las empresas que quieren tener éxito en la ciencia de datos, construir su práctica debería ser como armar un equipo deportivo.
Desde que el valor de la verdadera ciencia de datos para el negocio se volvió ampliamente reconocido hace unos años, las empresas han estado buscando científicos de datos. Sin embargo, el papel es una combinación de informática, estadística y conocimiento de negocios, y las organizaciones han tenido dificultades para encontrar trabajadores con esa mezcla de habilidades. Los candidatos que tienen todas estas habilidades, a menudo referidos como unicornios, en su mayoría trabajan en grandes compañías de internet como Facebook y Google.
Así que, para evitar este problema, las empresas deben adoptar un enfoque de equipo para la ciencia de datos. "Los equipos exitosos que he construido han venido de antecedentes no tradicionales", dijo Michael Ferrari, director de ciencia de datos en The Weather Company, un proveedor de datos y pronósticos meteorológicos que es ahora una división de IBM. "En este tipo de ambiente creo que eso es un punto fuerte".
Ha habido numerosas evaluaciones de la actual escasez de científicos de datos. Por ejemplo, McKinsey and Company proyecta un déficit de hasta 190,000 trabajadores con profundas habilidades de análisis en los EE.UU. para 2018. Al mismo tiempo, Glassdoor calcula el salario promedio de las posiciones de ciencias de datos en 113,436 dólares. Estos factores están haciendo necesario el enfoque de equipo.
Ferrari fue contratado recientemente para construir un equipo de ciencia de datos que aproveche los datos de localización generados por los usuarios de la compañía, para mejorar la orientación de los anuncios. Actualmente está en el proceso de contratar a siete u ocho nuevos trabajadores, y está buscando que vengan de una variedad de orígenes. Algunos deben tener fuertes habilidades de ingeniería de datos e informática. Otros deben tener conocimientos estadísticos más profundos. Ferrari también está buscando candidatos con antecedentes de negocios y ciencias sociales.
Ferrari dijo que cuando le llegan hojas de vida de las personas que dicen que pueden hacer todo lo relacionado con ciencia de datos para los negocios a nivel de experto, él asume que hay un poco de exageración. En lugar de buscar cajas específicas que estén aprobadas, busca habilidades blandas, como curiosidad, que pueden ser difíciles de evaluar durante un proceso de contratación típica, pero pueden ser más predictivas de éxito dentro de un equipo de ciencia de datos.
"En el pasado, buscaría el científico de datos perfecto", dijo Ferrari. "En realidad, esa persona no existe".
Lo que está pasando en la ciencia de datos ahora, con las empresas buscando extender tareas específicas a múltiples roles, en lugar de apilarlas en una posición, es similar a la evolución de TI del pasado, dijo P. K. Agarwal, decano regional en el campus de Silicon Valley de la Universidad Northeastern en San José, California.
Él dijo que los conocimientos básicos de informática solían ser el dominio de funciones específicas dentro de las empresas, pero ahora son estándar para casi cualquier tipo de posición. Lo mismo está sucediendo con la ciencia de datos en la actualidad. Agarwal predijo que dentro de tres a cinco años habrá más analistas de negocios que se especializan en sectores específicos, como la salud o la cadena de suministro. Estas personas provendrán en su mayoría de entornos de negocio y recogerán habilidades estadísticas. Al mismo tiempo, más trabajadores de negocios orientados a tecnología aprenderán los fundamentos de los sistemas más complejos como Hadoop y el aprendizaje automático. De cualquier manera, él piensa que la ciencia de datos va a incrustarse dentro de las funciones básicas de trabajo, en lugar de seguir siendo del dominio exclusivo de unos pocos altamente capacitados.
"Es solo que hay una gran demanda de científicos de datos", dijo Agarwal. "La estadística es un factor clave, pero la gente puede aprenderla".
Aun así, esto no significa que el trabajo va a desaparecer para los científicos de datos mejor entrenados, los verdaderos unicornios. Agarwal dijo que el mundo del análisis sigue evolucionando tan rápido, y con ello las necesidades de análisis de las empresas, que siempre habrá un montón de demanda de ellos. Incluso ahora, conforme el número de personas con habilidades básicas de análisis aumenta y el software automatizado recoge más holgura en la preparación de datos, la inteligencia artificial y los sistemas de computación cognitiva están llegando a la escena, exigiendo altos niveles de experiencia en el aprendizaje automático.
"La evolución del aprendizaje automático y la inteligencia artificial está yendo simplemente tan rápido", dijo Agarwal.