La ciencia de datos y la probabilidad de empleo formal para un migrante venezolano

La investigación liderada por docentes de Uninorte busca ser una herramienta útil para la toma de decisiones gubernamentales a favor de la población migrante, identificando, a través de datos estadísticos, las zonas con mejores probabilidades de empleo formal para esta población.

FOTOS-MIGRANTES-11.jpg
En el proyecto se utilizó una base de datos de 21 139 migrantes venezolanos.

Por:

31 ago 2021

¿Es posible predecir la zona con mayores probabilidades de empleo formal para un migrante en Colombia? La respuesta es afirmativa, si analizamos los datos sobre la población de migrantes venezolanos en Colombia y los lugares de acogida donde residen para, posteriormente, desarrollar una estrategia con un modelo de predicción que permita estimar las probabilidades de movilización, calidad de vida, empleabilidad, entre otros factores.

Ese es el eje del proyecto de Redistribución geográfica de migrantes venezolanos en Colombia, adelantado por un equipo interdisciplinar de investigadores conformado por los profesores del deparamento de Ingeniería Industrial de Uninorte: Gina Galindo Pacheco, Ph.D. en Industrial and Systems Engineering, y Daniel Romero, doctor en Ingeniería Industrial; la profesora del departamento de Economía, Sandra Rodríguez, economista con maestría en Economía y Economía Aplicada, y Daniel Rivera, magíster en Ingeniería Industrial y docente de la Universidad de California.

El estudio, desarrollado en asocio con el Inmmigration Policy Lab (IPL) de la Universidad de Stanford y financiado por USAID y la National Academy of Sciences, a través del programa PEER cycle 8, con el apoyo del Ministerio del Trabajo, ACNUR, entre otras organizaciones, adapta un algoritmo creado por el IPL al contexto colombiano, con el fin de generar recomendaciones de asentamiento para migrantes venezolanos en el país.

“Los migrantes venezolanos en Colombia se han concentrado, sobre todo, en las zonas fronterizas, lugares como Norte de Santander, La Guajira, Atlántico, Bogotá, entre otros, y no quiere decir que en esas tengan más oportunidades. De ahí surgió la idea, cómo pensar en un proyecto de investigación que pudiera ayudar a mejorar esa distribución geográfica de los migrantes venezolanos en Colombia”, aseguró la directora del proyecto, Gina Galindo Pacheco.

La doctora Galindo explicó que, para poder llegar a esas recomendaciones, fue necesario un trabajo arduo de investigación, en el que se adaptó el algoritmo de la Universidad de Stanford, el cual toma datos históricos (edad, género, experiencia laboral, ubicación de residencia, entre otros) de los migrantes que han llegado al país, y a partir de ahí tener claro el perfil del migrante y cómo ha sido su desarrollo en el entorno en función de la estabilidad integral de la población.

Posterior al análisis de los datos y limpieza de los mismos, se procede a una construcción de modelos de predicción. En esta área trabajaron los expertos en Ciencia de datos Daniel Rivera y Daniel Romero, para quien fue clave entender que esta problemática afecta el país y, por lo tanto, era necesario utilizar las herramientas disponibles que brindaran una solución a los migrantes y a las comunidades de acogida.

“Tenemos información del DANE y con esa información, producto de las encuestas que hacen ellos, procesamos esos datos para poder estimar la probabilidad de que los migrantes, por ejemplo, consigan empleo en diferentes lugares del país. Identificamos que había una fuente de información acerca de los migrantes en Colombia y luego diseñamos una solución que consideramos diferente, con el objetivo de producir estrategias para mejorar la calidad de vida de estas poblaciones”, enfatizó el analista de datos.

En el proyecto, en el que también participaron los estudiantes de la Maestría en Ingeniería Industrial Jhonattan Reales, José Navarro y Jhoan Castro, se utilizó una base de datos de 21 139 migrantes venezolanos, que corresponden a 11 044 familias. La base de datos se construyó a partir de los microdatos disponibles de la Gran Encuesta de Hogares (GEH) del Dane y módulo Migrantes, que comprende los períodos enero/2019-marzo/2020. La información recopiló los datos sobre: hogar, departamentos, género, edad, parentesco, estado marital, nivel de educación, experiencia laboral, rama de ocupación, tiempo en Colombia, horas de trabajo disponibles y ocupación.

A partir de allí se desarrolló un algoritmo para entrenar modelos que relacionan las covariables con la ocupación de los encuestados y, a través de un modelo predictivo, se logra tener información sobre la probabilidad de que un migrante consiga empleo formal en los diferentes departamentos de Colombia, teniendo en cuenta su perfil y características personales.

“Adicionalmente, se realizó un análisis de absorción que mide las capacidades de los departamentos de recibir población migrante, teniendo en cuenta un conjunto de indicadores socioeconómicos, tales como tasa de desempleo, índice de pobreza, cobertura en salud, etc, para tratar de hacer categorías que indiquen cuáles departamentos están en condiciones de recibir más población que otros, es como un análisis comparativo”, afirmó  Galindo.

En esta etapa fue importante el aporte de la profesora Sandra Rodríguez, quien apoyó la información requerida sobre los departamentos, lo que permitió establecer los indicadores de los lugares de acogida y la escogencia de las variables para los perfiles de los migrantes. La información mencionada se recopiló también a partir de la interacción con tres grupos focales de migrantes en Colombia, identificando que la población de adultos mayores y las mujeres son los que más dificultades tienen a la hora de conseguir un empleo formal.

"Como se puede observar en el gráfico, hay un conjunto de departamentos para los que el algoritmo recomienda la llegada de migrantes, mientras que hay otros para los que la recomendación es que los migrantes busquen un lugar de asentamiento diferente. En el primer grupo se tienen los departamentos de Valle, Antioquia, y la ciudad de Bogotá; mientras que en el segundo grupo se destacan los departamentos de Norte de Santander, La Guajira, Magdalena y Cesar", explicó la directora del proyecto.

Finalmente, se implementó un modelo de optimización para asignar hogares a departamentos, con el objetivo de maximizar la métrica de los hogares en conjunto, respetando restricciones relacionadas con: la capacidad de absorción de los departamentos, las necesidades de salud y educación de los hogares.

La investigación tiene proyectado incentivar el uso de los datos y los registros almacenados de información para crear estrategias desde las organizaciones, que contribuyan a solucionar problemáticas del país, por ejemplo, como la que se está desarrollando desde el Ministerio del Trabajo con el programa piloto de movilidad. El objetivo es que con los resultados arrojados se enriquezcan estos programas a través de los datos y las evidencias.

“Cada vez hay más registros almacenados de información y es importante que empecemos a usar esos datos, tratar de utilizar las herramientas para brindar una solución a las distintas problemáticas presentes en Colombia”, concluyó el analista Daniel Romero.

 

Por Katheryn Meléndez Solano.

Más noticias