Alejandra Pedroza Marchena
La mayoría de las mujeres con quienes convivimos todos los días han sido víctimas de violencia y, muy probablemente, no se dieron cuenta. Incluso, quizá en algún momento hemos ejercido violencia contra alguna mujer sin siquiera pensarlo. La violencia de género, específicamente contra las mujeres, se manifiesta en diversos actos cotidianos, muchos de ellos los tenemos tan normalizados que son casi imperceptibles.
Una de las formas que toma esta violencia de la que no nos damos cuenta es el discurso. Debido al avance de nuevas tecnologías para la comunicación, una parte de nuestros discursos cotidianos se ha mudado a la vida pública que mantenemos en redes sociodigitales.
Existen métodos efectivos para detectar dicha violencia contra las mujeres —que es perpetuada en discursos de odio en redes sociodigitales. Al ser un tipo de violencia en medios digitales, su estudio y detección merecen nuevos enfoques. Uno de los métodos posibles para detectarla es utilizar técnicas de programación; en concreto, la minería de datos.
En esta entrada se explican detalles sobre cómo son las violencias contra mujeres en redes sociodigitales y cómo es posible detectarlas con minería de datos.
¿Cómo ocurre la violencia de género?
En el mundo, tres de cada 10 mujeres han sufrido algún tipo de violencia (OMS, 2017). La situación de México es más acentuada. De los 46.5 millones de mujeres de 15 años y más que habitan el país, seis de cada 10 (30.7 millones) “ha enfrentado violencia de cualquier tipo y de cualquier agresor, alguna vez en su vida”(INEGI, 2017, p. 1).
Estas cifras muestran cómo la violencia de género, específicamente contra las mujeres, es una práctica social generalizada en el país y se materializa de las siguientes maneras (INEGI, 2017):
- Emocional
- Física
- Sexual
- Económica
- Discriminación
- Verbal
¿Qué hace que la violencia sea de género? Justo eso, que la causa es el género. Se trata de mujeres que han sido violentadas en la vida pública o privada y, al revisar la causa, nos damos cuenta que no hubo otra razón para agredir a la víctima (como robo o narcotráfico) más que haber sido mujer (OMS, 2017).
¿Cómo ocurre la violencia verbal en línea?
Un acto de agresión verbal se distingue por ser un ataque que no provoca lesiones físicas, por lo cual se materializa en discursos al utilizar como medio las palabras (Carmi-Iluz, Peleg, Freud, & Shvartzman, 2005; Mouradian, s.f.).
La violencia que ocurre desde el discurso ha encontrado nuevas plataformas y se ha digitalizado con la proliferación de las tecnologías de la información y la comunicación. Actualmente, es preciso hablar de una violencia en línea que puede pasar desapercibida desde una pantalla (Ruiz, 2014).
La violencia discursiva expresada a través de medios en Internet también hace uso del lenguaje para materializar ataques. Este tipo de violencia puede ser oral o escrita, a través de audios, videos o textos que se difunden en plataformas en línea.
De acuerdo con Bañón Hernández (2010), las mismas características de Internet propician agresividad y generan un ambiente en el que incluso las personas no agresivas pueden tener comportamientos agresivos en sus interacciones. Esto es debido a que los medios en Internet tienen propiedades relacionadas a:
- Anonimato: Identidad oculta de los interlocutores.
- Distanciamiento: Convierte en invisible al destinatario.
- Ubicuidad: Mayor exposición y disponibilidad a discursos agresivos.
- Desinhibición: Ausencia de normativas para los contenidos.
¿Cómo detectar la violencia verbal con algoritmos?
La violencia verbal existe como discurso en los contenidos que generamos en redes sociodigitales. Dado que estos actos se perpetúan de manera digital, su estudio merece acercamientos distintos al de la violencia que ocurre en espacios no virtuales.
Para ello, es posible utilizar técnicas de programación; en concreto, la minería de textos, la cual es una técnica dentro de la minería de datos que permite lograr una detección de violencia verbal automatizada, a través de algoritmos.
La minería de datos es el campo de las ciencias de la computación que se encarga de la exploración, procesamiento y análisis de grandes cantidades de datos para encontrar patrones que arrojen información (Arun K Pujari, 2009).
Dentro de la minería de datos existe la técnica de minería de texto, que analiza las opiniones, percepciones, sentimientos, evaluaciones, valoraciones, actitudes y emociones de las personas hacia entidades como productos, servicios, organizaciones, individuos, temas y eventos (Liu, 2012).
Una forma de realizar minería de datos es a través del análisis de sentimientos, el cual utiliza algoritmos que rastrean y evalúan el estado de ánimo de un público (Patel, Prabhu, & Bhowmick, 2015). Es decir: los discursos de personas usuarias en internet pueden ser examinados para identificar su polaridad o las emociones que connotan. Por ejemplo, la aparición de la palabra “contento” se puede relacionar con polaridad positiva o emociones como “alegría”.
El análisis de sentimientos se aborda desde tres enfoques principales (Thelwall, Buckley, & Paltoglou, 2011):
- Aprendizaje de máquina (machine learning)
- Análisis lingüístico
- Lexicón
El aprendizaje de máquina implica un conjunto de textos previamente clasificados según su polaridad o su emoción intrínseca, el cual sirve para entrenar a un algoritmo; éste predice la polaridad o emoción de nuevos textos al comparar los elementos que ya aprendió a clasificar con los elementos del nuevo texto.
El análisis lingüístico explota la estructura gramatical de un texto para predecir su polaridad y emoción; para ello, los algoritmos lingüísticos toman en cuenta el contexto, negaciones, superlativos y otros elementos del idioma para predecir la polaridad.
Mientras que los métodos basados en lexicón utilizan diccionarios o listas de palabras que fueron previamente codificadas según su polaridad y emoción. Posteriormente se busca la ocurrencia de estas listas de palabras en textos nuevos para así calcular su polaridad y emoción.
¿Qué se puede hacer?
El campo de acción para estudiar la violencia digital con herramientas tecnológicas parece no tener límite.
Por un lado, la evolución de las tecnologías es tan acelerada, que para realizar un mismo estudio se pueden probar diversas tecnologías. Python, R y Julia son algunos de los lenguajes de programación comunes para la minería de datos.
La minería de textos no sólo se puede abordar con distintos lenguajes de programación, sino también desde distintos enfoques. Así, cada enfoque de la minería de textos y el análisis de sentimientos (Aprendizaje de máquina (machine learning), Análisis lingüístico y Lexicón) es un campo de estudio en sí mismo. Incluso, se puede evaluar la eficacia de cada uno de ellos.
Por otro lado, existe bastante oportunidad para aplicar técnicas de programación al estudio de ciencias sociales. En México, ya hay quienes investigan desde el campo de las ciencias sociales computacionales, pero todavía queda mucho por hacer. Con técnicas de programación se pueden hacer análisis automatizados de discurso, de contenido, semióticos y otros más.
Finalmente, la detección de discursos de odio va más allá de la violencia verbal contra las mujeres. Es posible aplicar estas técnicas para detectar ataques a otros grupos de la población. A fin de cuentas, la detección es el primer paso para la prevención de cualquier tipo de violencia.
Para seguir aprendiendo
- Reporte de la situación de América Latina sobre la violencia de género ejercida por medios electrónicos (Naciones Unidas, 2017).
- Unsocial Media: The Real Toll of Online Abuse against Women (Dhrodia, 2017)
- Conferencia “Detectar discursos de odio en redes sociales” (Pedroza Marchena, 2020).
- ¿Qué es la minería de textos, cómo funciona y por qué es útil? (Universo Abierto [traducción], 2018)
Alejandra Pedroza Marchena (@Rojajaja). Maestra en Tecnologías de Información y licenciada en Periodismo por la Universidad de Guadalajara. Desarrolló un proyecto para detectar discursos de odio contra mujeres con algoritmos. Fue reportera en los periódicos El Informador y Mural de Grupo Reforma. Actualmente se desempeña como escritora técnica en Wizeline.