Nacional

Entrega Signa_Lab del Iteso al INE 108 preguntas depuradas para el Debate Presidencial

“Presento el esfuerzo de un equipo de 11 personas, entre profesores, estudiantes y becarios que seleccionó mediante técnicas y métodos, las 108 preguntas para el debate”, destacó Juan Larrosa Fuentes, director del Departamento de Estudios Socioculturales del Instituto

Especial

Especial

Las preguntas que se realizarán en el debate presidencial del próximo 7 de abril depuradas por Signa_Lab del Iteso fueron entregadas al Instituto Nacional Electoral (INE), son 108 las que cumplen con los parámetros de 24 mil que fueron recibidas.

En el sitio web del INE durante un mes se recibieron más de 24 mil reactivos que fueron entregados a Signa_Lab el pasado 22 de marzo en un documento Excel para que, con base en softwares especializados, uso de inteligencia artificial y otros métodos, se hiciera la elección de las preguntas, mismas que fueron entregadas en la sede del Instituto en una memoria USB que se encontraba en un sobre sellado.

“Presento ante ustedes el esfuerzo conjunto de un equipo de 11 personas, incluyendo profesores, estudiantes y becarios, cuya dedicación y profesionalismo merecen nuestro reconocimiento. Este grupo dedicó incontables horas a seleccionar, mediante una variedad de técnicas y métodos, las 108 preguntas para el próximo debate presidencial”, expresa Juan Larrosa Fuentes, director del Departamento de Estudios Socioculturales durante la entrega.

Carla Humphrey Jordán, presidenta de la Comisión Temporal de Debates del INE, explica que, durante el proceso de Signa_Lab, estuvieron presentes dando seguimiento, vigilancia y certificación durante el proceso por parte de personal de la Oficialía de Partes; añade que las preguntas serán entregadas el próximo miércoles 3 de abril a los moderadores del debate presidencial.

“Es muy importante mencionar que las candidatas y el candidato no conocerán estas preguntas hasta el debate, ése es otro paso en la metodología. Con esto estamos cerrando esta etapa de recibir estas preguntas (por parte) de una institución con todo el reconocimiento, como es el Iteso, a quien agradecemos el cumplir en tiempo y forma (…) Siguen algunas otras etapas, como la entrega del informe, y también de las bitácoras, que serán públicas para asegurar la trazabilidad y la replicabilidad de toda la metodología, y dar buena cuenta de transparencia y certeza a la ciudadanía, a los partidos políticos y a los medios de comunicación”, afirma Humphrey Jordán.

TRANSPARENCIA

En la entrega de las preguntas estuvo presente Catalina Morfín López, directora general académica del Iteso quien afirma que se cumplió cabalmente con los principios de transparencia, legalidad y certeza que exigía el trabajo encomendado, con ello considera que se fortalece la democracia.

“Nos alienta dar un paso, aunque sea pequeño, en la colaboración que debe existir e incrementarse día a día entre las distintas instituciones, organizaciones y grupos, con el propósito de dejar de lado la pretensión de que alguna visión de la vida es la única legítima, y de esta manera nos comprometemos con la comprensión empática, inteligente y dialogante entre las distintas posiciones, tanto políticas como ideológicas”, declara Morfín López.

PROCESO

La base de datos de las 24 mil preguntas recolectadas por el INE fue transportada de su sede oficial en Ciudad de México hacia Guadalajara, bajo la supervisión de expertos en ciberseguridad del Iteso se descargó en sistemas aislados de la red, para que Signa_Lab aplicara un análisis de datos a partir de los temas previstos del debate: Educación y salud; Transparencia y combate a la corrupción; No discriminación; Grupos vulnerables, y Violencia contra las mujeres.

En la primera etapa se depuró la base de datos a través del desarrollo de un diccionario de 519 términos proscritos que ayudaron a identificar preguntas con términos ofensivos o sesgos políticos. A partir de ello, se eliminaron mil 117 preguntas.

Después se utilizó un código informático para detectar preguntas con redacción idéntica y catalogarlas como repetidas, con lo que se encontraron mil 664 preguntas duplicadas, que fueron descartadas. Estas acciones resultaron en un total de 21 mil 219 preguntas.

El formulario del INE se basó en dos criterios esenciales: temático y territorial. En el aspecto temático, los participantes seleccionaron uno de los temas sugeridos para el debate, formulando una pregunta en esa categoría. En el criterio territorial, debían especificar la región del país desde la cual realizaban su consulta: norte, centro o sur.

ESTADÍSTICA

Signa_Lab Iteso implementó una fórmula estadística que arrojó una muestra estratificada por tema y región compuesta por mil 701 preguntas.

Para la tercera etapa se llevó a cabo un ejercicio con herramientas de inteligencia artificial y de lingüística de corpus. El proceso incluyó el desarrollo de un algoritmo que permitió la identificación de similitud semántica entre las preguntas de la muestra estratificada. Este algoritmo analizó mil 24 dimensiones dentro de cada pregunta y, a partir de ello, las agrupó en clústeres por sus similitudes. Como resultado se extrajeron 18 preguntas preseleccionadas por frecuencia y 90 preguntas preseleccionadas aleatoriamente.

Finalmente, en la cuarta etapa, se realizó una revisión manual de las 108 preguntas seleccionadas. Durante la primera ronda de revisión se identificaron 28 preguntas con errores de coherencia argumentativa, de sintaxis, de neutralidad y/o de pertinencia temática, características que están señaladas como criterios de invalidación en la metodología del INE, por lo que se procedió a su reemplazo por otras de la muestra preexistente —estos reemplazos no se debieron al proceso de depuración, sino a errores de origen en el propio registro de la ciudadanía

En la revisión subsiguiente de las nuevas 28 preguntas, 11 siguieron incluyendo criterios de invalidez. Un tercer y cuarto ejercicio de revisión resultaron en la eliminación de dos y una pregunta, respectivamente, por contener alguna de estas cualidades. La tasa total de reemplazo fue de 2.47 por ciento en relación con las mil 701 preguntas de la muestra estratificada.