Por Mailén García
Algunas reflexiones sociológicas sobre la producción de datos con perspectiva de género
“(N)o debemos olvidar que los datos, los sistemas de información, los modelos algorítmicos y las redes neuronales son generados por personas, están lejos de ser objetivos y no reflejan el panorama completo”, señala Mailén García en este texto que presenta algunos debates importantes para reflexionar sobre la producción y recolección de datos y estadísticas. Además de brindar información necesaria para interpretar problemas sociales, los datos evidencian sesgos y estereotipos presentes en la sociedad, observa la autora, y resulta necesario cuestionarlos, para hacerlos más representativos, justos e igualitarios.
Este artículo parte de la construcción de conocimiento en y desde la frontera para reflexionar sobre la imbricada relación que existe entre el territorio y el escritorio para la producción de información estadística. El principal objetivo es plantear cuatro puntos nodales, cuatro debates, que atraviesan a los procesos de producción y recolección de datos y estadísticas y que nos invitan a modificar algunas de las prácticas ritualizadas que se reproducen en la actualidad.
Cuantitativo y maximizable vs. cualitativo y singular
La dicotomía entre la metodología cuantitativa y cualitativa parece no tener fin. Existe una serie de discusiones teóricas que bregan por su conjunción y hasta intentos por tener cátedras de metodología de la investigación social en las que se las estudie en relación. Sin embargo, en el ejercicio profesional de la Sociología no me he topado más que con enormes barreras simbólicas y materiales entre unas y otras.
Los datos y la posibilidad de realizar análisis de grandes volúmenes de información permiten construir una imagen, una especie de primera foto en blanco y negro de cómo está la situación. Por supuesto, son y serán incapaces de contarnos lo que efectivamente le ocurre a esa persona, pero permitirán comprender tendencias, frecuencias, prevalencias, modas. ¿Por qué son importantes? Porque evidencian que lo que ocurre no es individual sino colectivo.
El feminismo de los años sesenta de Estados Unidos y Francia1 supo poner en cuestión que los problemas de las mujeres no eran individuales, sino colectivos y partían de una matriz de opresión.
datos + datos = patrón → comprender matrices de dominación, de opresión, de desigualdad.
Por su parte, las metodologías cualitativas focalizan en las personas, en las experiencias individuales para narrar, así, siguiendo con la metáfora de las fotos, éstas toman color. Las metodologías cualitativas permiten aprehender cómo un conjunto de personas experimenta determinadas opresiones, conocer historias de vida o acceder a testimonios de primera mano. En definitiva, nos recuerdan constantemente que detrás de los números hay personas. Siguiendo con la experiencia individual, en lo personal, pienso que las metodologías cualitativas nos previenen de caer en la deshumanización de creer en variables o tendencias como si fueran entes en sí mismo y no construcciones ficticias que utilizamos para hacer inteligible la realidad y explicar lo que le ocurre a cientos, miles o millones de personas.
voces + experiencias = relatos de vida → comprender cómo se siente esa persona y conocer su trayectoria de vida.
Sin embargo, la barrera invisible que se teje entre las metodologías cuantitativas y cualitativas es tal que es posible encontrarse con matemáticos que diseñan muestras censales según probabilidades y no consideran factores como la estacionalidad de las viviendas en ciudades turísticas porque alteran la aleatoriedad de la muestra. Y luego, se enojan con las bajas tasas de respuestas porque quedan seleccionadas una enorme cantidad de viviendas deshabitadas. Tristemente esta anécdota es una historia real, es una discusión de las tantas que tuve mientras trabajaba en una oficina de estadística.
También existen instituciones e investigadores a los que cuando se les pregunta por los datos que sustentan tal o cual afirmación, no hacen más que argumentar que “es lo que se ve en el barrio”, “es lo que dicen mis informantes”. El problema aquí no son las opiniones, sino el riesgo de que argumentos sin sustento empírico sean utilizados para la producción de conocimiento científico o el desarrollo de políticas públicas.
El desafío por superar esta dicotomía no es nuevo ni actual, aunque se reactualiza conforme las discusiones sobre big data avanzan. Esto se debe a que se incrementa el riesgo de ver números sin pensar en las personas que conforman ese universo de análisis. Es por ello que se torna indispensable volver a centrar esta discusión para pensar articulaciones posibles entre ambas metodologías, puentes que den lugar a formas de construcción de conocimiento que condensen los aspectos centrales de cada una.
La urgencia de la desigualdad y la importancia de los datos
El segundo debate sobre el cual me gustaría referirme y que debería estructurar algunos de los trabajos que existen en la actualidad en políticas de datos, es el de la desigualdad. Vivimos en la región más desigual del mundo y el 63% de las infancias en Argentina son pobres2. ¡Sí, 63%!
Las ciencias sociales han teorizado y debatido sobre las condiciones estructurales de la pobreza en la región, algunas incluso han pasado a la acción con programas de políticas públicas focalizados en la reducción de brechas. En Argentina se han producido abordajes desde la historiografía3, desde un enfoque de estratificación social4, de la estructura social argentina5, de la desigualdad6, de la pobreza7 y con un enfoque en las infancias desde el Observatorio de la Deuda Social de la Universidad Católica Argentina8.
A su vez, es posible encontrar ejemplos de políticas públicas focalizadas en la reducción de la pobreza en la región a través de transferencias condicionadas de ingresos. Sin embargo, entre la crisis del COVID-19 y la crisis económica, la pobreza no ha hecho más que aumentar. Incluso recientemente, el informe ‘El estado de la inseguridad alimentaria en el mundo 2021′9, elaborado por cinco agencias de Naciones Unidas, evidencia los peores datos de la década en términos de hambre y malnutrición.
¿Pueden los datos contribuir a la reducción de la pobreza? La respuesta es un gran “sí, pero…”. Sí pueden, pero necesitamos que las personas que toman las decisiones de implementación de políticas públicas los utilicen para maximizar sus resultados. La información vale y es vital para solucionar este problema. Sin embargo, pareciera que ni el Estado ni las áreas de responsabilidad social empresarial resultan muy interesados en utilizar la big data para reducir la desigualdad.
Un ejemplo de ello está en el mismo Ministerio de Desarrollo Social de la Nación, que no cuenta con un área consolidada en datos, con mapas y tableros en tiempo real que le permitan desarrollar políticas focalizadas donde las urgencias son mayores (en el conurbano bonaerense la pobreza infantil alcanza 72,7%) y políticas a largo plazo para mejorar la situación de las infancias.
Otro ejemplo de la falta de creación de datos para comprender dinámicas de pobreza y poder desarrollar políticas para reducirla lo encontramos en las muestras de la mayoría de las encuestas nacionales realizadas por el Instituto Nacional de Estadísticas y Censos (INDEC). Estas no incluyen relevamiento en villas y asentamientos, donde viven las personas más vulneradas del país. ¿Qué sabemos sobre la situación crítica y de vulnerabilidad en las que viven las personas en Argentina? Muy poco.
Ahora bien, la pobreza en las infancias debe ser analizada con datos (que no tenemos muchos) y con perspectiva de género. ¿Por qué? Porque la pobreza está feminizada, las mujeres son más pobres (63% de mujeres se ubican en el primer decil de ingreso sobre 37% de varones, inversamente 37% de mujeres se ubican en el decil más alto de ingresos sobre 63% de varones), según los datos publicados por INDEC para el 3° trimestre de 202010. Son las mujeres las que crían solas a las infancias pobres, son las mujeres las que no acceden a puestos de trabajo de mejor remuneración, son las mujeres las que cargan con toda la responsabilidad y son las mujeres a las que el Estado elige invisibilizar.
Una aclaración en este sentido: las mujeres no son las únicas que viven en situaciones de vulnerabilidad y el Estado elige invisibilizar, una situación similar atraviesan las personas trans, especialmente las feminidades trans, sobre las que poquísimos datos tenemos. Sabemos por sus historias de vida, por investigaciones cualitativas, que viven en condiciones de exclusión y marginalidad. No tenemos datos sobre cuántas de ellas viven en condiciones de pobreza e indigencia, ni tampoco sobre sus condiciones de empleo o acceso a la vivienda.
El debate sobre las condiciones que generan y estructuran la pobreza es vasto. Lo que me interesa puntualizar aquí está en relación con la responsabilidad política de que ciertos datos no existan y en consecuencia, que no se desarrollen políticas públicas que partan de análisis empíricos con solidez metodológica. Así como tampoco que estas políticas públicas produzcan datos confiables para el monitoreo y evaluación, con el objetivo de medir si efectivamente logran reducir la pobreza. Mientras tanto, la pobreza apremia e hipoteca futuros y los datos no parecen ser insumos dispuestos a utilizarse.
Los transfeminismos interseccionales y decoloniales
La tercera discusión que me gustaría recuperar para pensar los procesos de producción de la información y de los datos deviene de los postulados de los transfeminismos interseccionales y decoloniales.
Los feminismos, especialmente el feminismo negro, el feminismo decolonial, y el feminismo queer, se escribe y se piensa desde las márgenes, desde el Sur, desde lo subalterno, discute contra la hegemonía blanca de los varones y las mujeres cis del hemisferio norte. Estos feminismos vienen a plantear que sus demandas, que sus problemas, que sus vidas nada tienen que ver con las de las mujeres cis, heterosexuales, de centros urbanos de países ricos. Así, sus propuestas y sus llamamientos a la acción están centrados en los márgenes, en la posibilidad de ser “otredades”.
Sus postulados nos legan la posibilidad de narrar vidas y posibilidades de ser que la hegemonía niega sistemáticamente. Es por ello que, si pensamos en el mundo de los datos, no nos alcanza con revisar algunas de las formas en las que se registran ciertas variables.
La pregunta que dispara la reflexión es ¿queremos continuar con los mismos procesos de producción de los datos estadísticos que históricamente invisibilizaron a las mujeres, a las personas trans, a las personas en situación de vulnerabilidad? Si la respuesta es “no”, entonces es necesario revisar integralmente su proceso de producción.
Hernán Otero, en “Demografía política e ideología estadística en la estadística censal argentina” señala la relación política entre el encuestador y el modelo del Estado argentino. De esta manera pone de manifiesto una producción estadística al servicio de los ideales de la Nación recién emergida. Por tanto, si no somos capaces de revisitar las discusiones del feminismo negro, del feminimo decolonial, de los estudios queer, de la teoría travesti de Wayar, difícilmente seremos capaces de tener datos que nominen a las identidades trans.
Las personas cis-género y especialmente los varones, han dominado tanto la producción de datos y de estadística que existen formas y datos que son incomensurables desde las vivencias trans y no binarias. No solo que los datos no los nombran sino que tampoco explican sus vidas. De modo que, si no queremos continuar reproduciendo información que es producida bajo estructuras patriarcales y hegemónicas, necesitamos repensar los sistemas de producción de los datos desde el Sur, haciendo partícipes al colectivo de personas trans y no binarias, es decir, con un proceso colaborativo, con perspectiva de género e interseccional.
La epistemología y la metodología de investigación en juego
La última y más estructurante de las discusiones es la de la construcción epistémica o, dicho más en criollo, la de cómo intentar matar de una vez y para siempre al universal androcéntrico.
La ciencia no es objetiva, mucho menos la ciencia de datos. Catherine O’Neil en la charla TED titulada “The era ir blind faith in big data must end”11 sostiene que los algoritmos son opiniones que se convierten en código. En esta línea, Diana Maffía12 señala que los sesgos en los algoritmos pueden ocurrir en tres partes: la definición del objetivo, al introducir los datos y al elegir un atributo.
Quisiera plantear dos consideraciones sobre la pretensión de objetividad y neutralidad en inteligencia artificial. La primera es que ésta reproduce concepciones estereotipadas y sesgadas de la ciencia sobre la objetividad que han sido discutidas en torno a la posición epistémica y el rol de la ciencia desde Tomás Kuhn en adelante. La segunda, es que bajo la noción de objetividad y universalidad se esconde el más profundo androcentrismo, el que piensa desde y como un investigador del siglo XIX (o lo que es igual a decir como varones cis blancos del Hemisferio Norte con pretensiones de saber).
Las epistemologías feministas con Harding y Haraway a la cabeza, vuelven manifiesto el carácter histórico, singular y situado de la producción científica. No hay universales, no hay un “hombre”, hay mujeres cis, varones cis, mujeres trans, varones trans y personas trans no binarias. Sin embargo, esta discusión parece no estar presente en el campo de la ciencia de datos.
Como socióloga no puedo dejar de preguntarme por los motivos que hacen que en pleno siglo XXI, la inteligencia artificial emerja como una especie de “salvador universal y objetivo” de los problemas, en una forma totalizante y mística, sin siquiera considerar que los sesgos que produce y reproduce están en estrecha relación con las personas que investigan. Tampoco puedo evitar volver a Pierre Bourdieu para recuperar la vigilancia epistemológica, como concepto y como praxis. Así y solo así tendremos la oportunidad de revisar los procesos de producción, recolección, análisis y publicación de los datos con rigurosidad técnica y perspectiva de género que nos prevenga de seguir reproduciendo concepciones estereotipadas sobre lo femenino y lo masculino, lo universal y lo particular. Formas que están mucho más en relación con el sentido común de los investigadores que con la ciencia misma.
Howard Becker escribió “Para hablar de la sociedad, la sociología no basta”, un libro que muestra cómo las pretensiones de saber explican, pero no bastan. En este texto y con la licencia de hacer una alusión a su obra, juego con las palabras para pensar que para hablar de la sociedad, los datos y los algoritmos no bastan. Los datos proporcionan información para interpretar problemas sociales y evidencian sesgos y estereotipos presentes en la sociedad. Sí, los datos son una parte del entramado de representaciones que necesitamos para interpretar el mundo en el que vivimos y nos urge que sean más representativos, más justos y más igualitarios. Pero no debemos olvidar que los datos, los sistemas de información, los modelos algorítmicos y las redes neuronales son generados por personas, están lejos de ser objetivos y no reflejan el panorama completo. Es urgente comenzar a cuestionar la presunción de objetividad y de buenas intenciones en el mundo tecnológico, donde las empresas son las que llevan la delantera y marcan el ritmo de lo que se desarrolla y también de lo que no.
Mailén García es licenciada en Sociología (UNMdP) y Magister en Derechos Humanos y Democratización en América Latina y el Caribe (UNSAM). Actualmente es Directora de Planificación Estratégica en DataGénero, investigadora especialista en estadísticas sociales con perspectiva de género (BID-provincia de Buenos Aires) y docente universitaria.
Redes sociales: twitter @maigarcia24 / instagram @maigarciaaa
1 Se toman como máximas referentes de estos feminismos a Simone de Beauvoir y su clásico “El segundo sexo” y Betty Friedan con “La mística de la feminidad”.
2 Los datos se desprenden del procesamiento para el IV trimestre del 2020 de la EPH. Véase en https://www.infobae.com/economia/2021/05/17/el-dato-que-mas-duele-la-pobreza-entre-los-ninos-roza-el-73-en-el-conurbano-bonaerense/
3 Por ejemplo está el trabajo de Adamovsky, E. (2012). Historia de las clases populares. Buenos Aires: Sudamericana.
4 Se destacan las investigaciones de Torrado, S. (1994). Estructura social de la Argentina. Buenos Aires: Ediciones de la Flor y Torrado, S. (2007). Población y Bienestar en la Argentina del primero al segundo centenario. Buenos Aires: Editorial Edhasa.
5 Entre otros véase Del Cueto, C. y Luzzi, M. (2008). Rompecabezas: transformaciones en la estructura social argentina. Los Polvorines: Univ. Nacional de General Sarmiento; Buenos Aires: Biblioteca Nacional.
6 Un ejemplo de estos estudios es: Salvia, A. y Rubio, M. comp. (2019). Tendencias sobre la desigualdad: aportes para pensar la Argentina. Ciudad Autónoma de Buenos Aires: Universidad de Buenos Aires. Instituto de Investigaciones Gino Germani.
7 Kessler, G. y Di Virgilio, M. (2008). La nueva pobreza urbana: dinámica global, regional y argentina en las últimas dos décadas. Santiago de Chile: CEPAL.
8 Por ejemplo: Tuñon, I. (2018). (In)equidades en el ejercicio de los derechos de niñas y niños. Derechos humanos y sociales en el período 2010-2017. Buenos Aires: EDUCA.
9 Recuperado de http://www.fao.org/publications/sofi/2021/es/
10 Véase el informe de EPH del tercer trimestre de 2020. Recuperado de https://www.indec.gob.ar/uploads/informesdeprensa/ingresos_3trim20059C17EA4D.pdf
11 Recuperado de https://www.ted.com/talks/cathy_o_neil_the_era_of_blind_faith_in_big_data_must_end
12 Estos conceptos son introducidos en el 1st WBDS-LA 2020 Women in STEM conversatory. Recuperado de https://www.youtube.com/watch?v=kS9yt9z0Gow