Manuel Etesse INTRODUCCIÓN AL ANÁLISIS DE DATOS CUALITATIVOS CON INTELIGENCIA ARTIFICIAL ���������������������������������� ������������� ��� ��� ������������ El autor es doctor en Sociología por la Université Paris Cité Sorbonne (Francia), magíster en Población y Desarrollo por la misma casa de estudios y licenciado en Sociología por la Pontificia Universidad Católica del Perú. En la PUCP es docente a tiempo parcial de la Facultad de Ciencias Sociales desde el año 2016 y profesor a tiempo completo del Departamento de Educación desde 2024. Se ha desempeñado en múltiples organizaciones públicas y privadas vinculadas al desarrollo, la educación y la juventud en Perú y Francia. Sus temas de interés son educación y sociedad, juventudes y población, tecnología y métodos de investigación social y educativa. M a nuel Etesse Manuel Etesse INTRODUCCIÓN AL ANÁLISIS DE DATOS CUALITATIVOS CON INTELIGENCIA ARTIFICIAL Contacto: manuel.etesse@pucp.edu.pe https://www.linkedin.com/in/manuel-etesse https://www.researchgate.net/profile/Manuel-Etesse https://orcid.org/0000-0002-1521-5405 DOI: https://doi.org/10.18800/978-612-4355-17-2 INTRODUCCIÓN AL ANÁLISIS DE DATOS CUALITATIVOS CON INTELIGENCIA ARTIFICIAL Guía práctica para usar ChatGPT en la investigación social y educativa Manuel Etesse Introducción al análisis de datos cualitativos con inteligencia artificial: Guía práctica para usar ChatGPT en la investigación social y educativa Autor Manuel Etesse, 2024 (manuel.etesse@pucp.edu.pe) Pontificia Universidad Católica del Perú Facultad de Ciencias Sociales https://facultad.pucp.edu.pe/ciencias-sociales/ Centro de Investigaciones Sociológicas, Económicas, Políticas y Antropológicas, Cisepa https://cisepa.pucp.edu.pe/ Av. Universitaria 1801, Pueblo Libre, Lima 15088, Perú Licencia: Esta obra está bajo una licencia de Creative Commons Reconocimientos. No Comercial. Compartir Igual 4.0 Internacional (https://creativecommons.org/licenses/by-nc- nd/4.0/). Se debe reconocer explícitamente la autoría de los contenidos, no se puede utilizar el material para una finalidad comercial, y si se mezcla, transforma o crea a partir del material, no se puede difundir el material modificado. Ilustraciones: el conjunto de figuras, recuadros y tablas, diagramas y recuadros son elaboración propia del autor, a menos que se indique lo contrario. Se incluyen capturas de pantalla provenientes de ChatGPT 3.5. Género y lenguaje: se buscaron términos neutros en relación al género masculino, el uso del género masculino hace referencia a todas las personas de una población independientemente de sus características individuales. Posibles errores: de corresponder, el señalamiento de errores se realizará a través de la página web del autor (https://sites.google.com/pucp.edu.pe/etesse/inicio) Corrección de texto: Eleana Llosa Primera edición digital: junio de 2024 Hecho el depósito legal en la Biblioteca Nacional del Perú N° 2024-05084 e-ISBN: 978-612-4355-17-2 DOI: HTTPS://DOI.ORG/10.18800/978-612-4355-17-2 6 Introducción al análisis de datos cualitativos con inteligencia artificial Índice general Prólogo 11 Introducción 15 ¿Inteligencia artificial para potenciar el análisis cualitativo? Capítulo 1 La estrategia Aexco y el uso ético de ChatGPT 1.1. Apuesta metodológica 21 1.2. Uso ético de la inteligencia artificial 25 Capítulo 2 Preparar el análisis: obtención de una asistencia útil para mi proyecto 2.1. Primeros pasos: entrar a ChatGPT 31 2.2. El entrenamiento CORI-F 33 Capítulo 3 Explorar mis datos paso a paso con ChatGPT 3.1 Primeros pasos: orientaciones básicas 41 3.2. Técnica 1. Selección de citas llamativas 49 3.3. Técnica 2. Síntesis casuística 53 3.4. Técnica 3. Recurrencia de términos 54 3.5. Técnica 4. Constatación de inconsistencias 55 3.6. Evaluación de los resultados 58 7 Capítulo 4 Codificar contenidos paso a paso con ayuda de ChatGPT 4.1. Primeros pasos: orientaciones básicas 61 4.2 Técnica 1. Codificación predefinida 71 4.3 Técnica 2. Codificación emergente 74 4.4 Evaluación crítica de los resultados 77 Cierre 81 Referencias bibliográficas 83 Siglas 87 Índice de consejos Consejo 1. Evalúa el entrenamiento por medio de preguntas 37 Consejo 2. ¡Usa los pulgares! 39 Consejo 3. Recuerda frecuentemente el OE 52 Consejo 4. Usa regenerate 57 Consejo 5. Haz una retroalimentación a ChatGPT 60 Consejo 6. El uso de formatos ordenados para la codificación 76 Consejo 7. Haz una retroalimentación a ChatGPT 79 Índice de figuras Figura 1.1. Ilustración de la secuencia inicial de la estrategia Aexco para el análisis de datos cualitativos 24 Figura 1.2. Diagrama de flujo para el uso seguro de ChatGPT 27 Figura 1.3. Circuito cerrado de investigación 28 Figura 2.1. Página principal de ChatGPT 31 Figura 2.2. Interfaz inicial de ChatGPT 32 Figura 2.3. Prompt del contexto del trabajo 35 Indice general 8 Introducción al análisis de datos cualitativos con inteligencia artificial Figura 2.4. Prompt del OE del trabajo de investigación 35 Figura 2.5. Prompt del rol en el trabajo de investigación 36 Figura 2.6. Prompt del uso de la información proporcionada a ChatGPT 36 Figura 2.7. Confirmación de los prompts del contexto y objetivos 37 Figura 2.8. Confirmación de los prompts del rol y el uso de la información 38 Figura 2.9. Resultados de preguntas acerca del proyecto de investigación 38 Figura 2.10 Ubicación de los pulgares de retroalimentación en la interfaz de ChatGPT 39 Figura 3.1. Secuencia de preguntas motivadoras para la exploración inicial de datos cualitativos 42 Figura 3.2. Entrenamiento CORI-F para la exploración 49 Figura 3.3. Prompt para realizar la selección de citas relevantes 50 Figura 3.4. Resultados de la selección de citas relevantes en ChatGPT 51 Figura 3.5. Señalamiento del OE en la indicación (prompt) del procedimiento de selección de citas 52 Figura 3.6. Prompt para realizar la síntesis casuística en ChatGPT 53 Figura 3.7. Resultados de la síntesis del caso por parte de ChatGPT 53 Figura 3.8. Prompt para realizar un recuento de las palabras más frecuentes en ChatGPT 54 Figura 3.9. Resultados del recuento de términos por parte de ChatGPT 55 Figura 3.10. Prompt para identificar inconsistencias en ChatGPT 56 Figura 3.11. Resultados de la identificación de inconsistencias por parte de ChatGPT 56 Figura 3.12. Opción regenerate en ChatGPT 57 Figura 4.1. Entrenamiento CORI-F para la codificación 72 9 Figura 4.2. Prompt para la creación de códigos predefinidos en ChatGPT 73 Figura 4.3. Resultados de la codificación predefinida en ChatGPT 73 Figura 4.4. Prompt para realizar la codificación emergente 74 Figura 4.5. Resultados de la codificación emergente en ChatGPT 75 Figura 4.6. Indicar formatos para la codificación inicial en ChatGPT 76 Índice de recuadros Recuadro 3.1. Caso ilustrativo: Discurso presidencial de un expresidente 45 Recuadro 4.1. Guía de entrevista del proyecto «Trayectorias laborales y educativas de personas con discapacidad» 66 Recuadro 4.2. Fragmento de entrevista a Celia, proyecto «Trayectorias laborales y educativas de personas con discapacidad» 67 Índice de tablas Tabla 3.1. Términos del proyecto de investigación «Discursos presidenciales» 45 Tabla 3.2. Evaluación del desempeño de ChatGPT en la exploración de datos cualitativos 59 Tabla 4.1. Términos del proyecto de investigación «Trayectorias laborales y educativas de personas con discapacidad» 65 Tabla 4.2. Fortalezas y debilidades identificadas en el proceso de codificación inicial con ChatGPT 78 Indice general 11 Prólogo La inteligencia artificial ya ha llegado, pero aún queda mucho camino por recorrer. Mustafa Suleyman y Michael Bhaskar1 La presente guía práctica para el uso de ChatGPT2 en la inves- tigación social y educativa es resultado de una iniciativa del pro- fesor Manuel Etesse, docente de la Facultad de Educación de la Pontificia Universidad Católica del Perú (PUCP), quien desde 2016 cuenta con una vasta trayectoria en la enseñanza de cursos y ta- lleres vinculados al procesamiento y análisis de datos impartidos en la Facultad de Ciencias Sociales. En los últimos años, Etesse ha innovado en el campo de la inteligencia artificial (IA), en base a lo cual propuso el «Taller de introducción al análisis social de datos cualitativos usando inteligencia artificial». A partir de dicha experiencia, elaboró este manual, que ofrece una explicación sobre el sentido y el amplio alcance de ChatGPT, aplicación desarrollada por Open AI en 2022, la cual, a través de sistemas informáticos, procesa información y data requerida en distintos campos: salud, comercio, educación, comunicaciones, investigación, planeamien- to, traducción, artes y creación de imágenes, entre otros. En el caso 1 Ver Tecnología, poder y el gran dilema del siglo XXI. La ola que viene (2023, p. 73; Penguin Random House). 2 Chat Generative Pre-Trained Transformer; es un chatbot, es decir, un bot conversacional, muy potente. prologo 12 Introducción al análisis de datos cualitativos con inteligencia artificial de ChatGPT, como en el de toda herramienta, es importante cono- cer las potencialidades de su uso, así como sus limitaciones, lo cual se muestra en esta publicación. Como señala el autor, la IA tiene un enorme potencial para la investigación social. En el caso del análisis de datos cuali- tativos, por ejemplo, ChatGPT abre muchas posibilidades en la investigación social y educativa, considerando la riqueza de da- tos y contenidos que proceden de entrevistas, normas, grupos focales y documentación que se requiera analizar. Para mostrar- lo, Etesse presenta de manera didáctica y práctica ejemplos de investigaciones realizadas por él mismo para procesar y anali- zar información primaria. Tales ejemplos ayudan a comprender y aplicar las técnicas de investigación que se pueden emplear con ChatGPT. No obstante, también hay que advertir el uso ético de este tipo de programas y estar en permanente vigilancia epistemológi- ca, como señalaba Pierre Bourdieu3. No se trata de que el investi- gador o la investigadora delegue a la aplicación los resultados de su estudio, porque ChatGPT no reemplaza el trabajo que realiza el profesional, sino que lo complementa, acercándose, quizá, al tipo de colaboración que se puede tener de un o una asistente de inves- tigación. El o la investigadora requiere realizar previamente una selección inicial de datos resaltantes y debe poseer ideas sobre cómo organizar la información, así como haber llevado a cabo un potencial análisis. Así podrá saber que la información arrojada por 3 «La práctica de la sociología reflexiva» (en Bourdieu, P. y Wacquant, L., Una invitación a la sociología reflexiva; 2005, pp. 266-317; Siglo XXI). 13 Prólogo ChatGPT es verosímil, con base en los datos de investigación. Así, pues, resalta la centralidad del investigador en el proceso. De acuerdo a Noam Chomsky4, este tipo de aplicaciones no son propiamente «inteligentes», al menos como lo son los seres humanos. A diferencia de lo que ellas hacen, los humanos podemos almacenar pequeñas cantidades de información a través de la cual no solo se busca generar correlaciones entre puntos, sino más bien y sobre todo crear posibles explicaciones. En otras palabras, dichas aplicaciones no poseen la capacidad que tiene como especie el ser humano de razonar y generar reflexión crítica. Mediante la publicación de este manual, desde la Facultad de Ciencias Sociales, así como desde el Centro de Investigaciones Sociológicas, Económicas, Políticas y Antropológicas (Cisepa), buscamos contribuir a que tanto los y las estudiantes de la facultad como otras personas interesadas puedan conocer la utilidad de la aplicación ChatGPT y los nuevos modelos conversacionales. Asimismo, esperamos aportar a la reflexión y el debate sobre la implicancia de esta tecnología en la transformación de todos los niveles de la vida, incluida la labor de investigación. 4 «The false promise of ChatGPT» (en The New York Times, 8 de marzo de 2023; https:// www.nytimes.com/2023/03/08/opinion/noam-chomsky-chatgpt-ai.html). Paola Patiño Rabines Directora ejecutiva Centro de Investigaciones Sociológicas, Económicas, Políticas y Antropológicas Pontificia Universidad Católica del Perú Fanni Muñoz Cabrejo Decana Facultad de Ciencias Sociales Pontificia Universidad Católica del Perú 15 INTRODUCCIÓN ¿Inteligencia artificial para potenciar el análisis cualitativo? Desde el lanzamiento de ChatGPT a finales del año 2022, el avance de la inteligencia artificial (IA) generativa está transfor- mando la vida y el trabajo a nivel global. En la esfera de la creación científica y humanística, este fenómeno toca todos los ámbitos del quehacer: desde la ciencia matemática hasta la creación en artes plásticas. Su desarrollo es exponencial, por lo que hoy se hace di- fícil imaginar el futuro sin IA. ChatGPT es una aplicación que pertenece a la organización sin fines de lucro OpenAI Incorporated y a la corporación OpenAI Li- mited Partnership, empresa con sede en el estado de California, en los Estados Unidos (OpenAI, 2023). Esta aplicación rompió los es- quemas debido a que cuenta con una interfaz tan simple y amiga- ble como lo es una ventana virtual de conversación, un chat. Qui- zás por ello, cinco días después de su lanzamiento ya contaba con más de un millón de usuarios inscritos (Firat, 2023). Lo que más atrae al público hacia ChatGPT se explica por el significado de sus siglas: generative pretrained transformer, es decir, es un «transfor- mador generativo preentrenado» basado en un modelo de lenguaje natural a gran escala (LLM) con capacidad de sostener una con- 16 Introducción al análisis de datos cualitativos con inteligencia artificial versación, o «chatear», con una persona y brindar sorprendentes grados de coherencia y relevancia en sus respuestas. Asimismo, cuenta con tres valiosas capacidades: recuerda el contenido de la conversación, provee información a partir de grandes fuentes de información y tiene el potencial de transformar textos. Sin embar- go, como veremos más adelante, algunas de estas capacidades presentan limitaciones que se deben tratar con sumo cuidado y entendimiento. La IA tiene un gran potencial en la investigación social al ofrecer la capacidad de analizar grandes cantidades de datos de manera eficiente y de identificar patrones complejos. La intersección entre la innovación tecnológica y la investigación plantea oportunidades y desafíos para el análisis empírico de datos (Vargas-Bianchi, 2023). Así, en particular, resulta útil el uso de ChatGPT en el análisis de datos cualitativos en la investigación social y educativa, datos caracterizados por la riqueza de los contenidos provenientes de entrevistas, discursos, normativas, materiales didácticos y grupos focales, entre muchos otros (Lopezosa y Codina, 2023; Lopezosa et al., 2023). Se ha podido ver que, a partir de experiencias prácticas, ChatGPT puede ser una herramienta valiosa especialmente en el análisis de documentos y entrevistas cuando se le asigna un rol pertinente y se proporcionan instrucciones adecuadas (Anis y French, 2023; Rahman et al., 2023). No obstante, es esencial que el investigador lleve una constante supervisión o «auditoría» para garantizar la pertinencia y validez de los resultados. Los contenidos que aquí se presentan son resultado de diver- sas rondas de revisiones de la literatura naciente sobre el tema. En paralelo, provienen de experiencias concretas de investigación y en- señanza, cuyo rasgo principal ha sido la experimentación constante y la reflexión crítica sobre los alcances de cada procedimiento. Por 17 Prólogo ello, esta guía propone, para cada técnica presentada, una evalua- ción precisa de las potencialidades y limitaciones identificadas. El objetivo de este trabajo es presentar un marco claro y útil para el uso de la IA generativa en el estudio de contenidos cualita- tivos, así como detallar, paso a paso, procedimientos específicos que pueden contribuir a su aplicación en una gran diversidad de temáticas específicas. En este sentido, la presente propuesta tiene vocación multidisciplinaria, dado que busca ser útil para un amplio espectro de disciplinas, epistemologías y metodologías en la prác- tica del análisis de datos cualitativos. En particular, esta propuesta de análisis asistido por ChatGPT presenta seis técnicas eficaces y creativas para las fases de ex- ploración y codificación en el marco de un diseño metodológico elaborado por personas (no por IA). El descubrimiento y la clasificación de los contenidos objeto de análisis pueden beneficiarse mucho de insumos producidos por la IA con el objetivo de enriquecer las nacientes perspectivas del investigador —no para reemplazarlas o crearlas— acerca de contenidos que él ya conoce. Estos insumos, como aquellos que produce un asistente de investigación humano, pueden servir para hallar nuevas pistas analíticas, apoyar la identificación de patrones y brindar elementos para fortalecer la abstracción del investigador responsable. Es importante resaltar que tales insumos han de ser principalmente un complemento a la mirada propia del investigador —a través de la lectura y el análisis directo de contenidos— y no un sustituto de ella. Fue en las aulas de la Facultad de Ciencias Sociales de la Pon- tificia Universidad Católica del Perú (PUCP) y en la Escuela de In- Introducción 18 Introducción al análisis de datos cualitativos con inteligencia artificial vestigadores del Centro de Investigaciones Sociológicas, Econó- micas, Políticas y Antropológicas (Cisepa) donde esta propuesta tomó forma. Por ello, agradezco a la Dirección de Estudios por po- sibilitarme impartir el curso interdisciplinario Taller de Herramien- tas Cualitativas para el Análisis Social en el verano de 2023, en el que se intercambiaron las primeras reflexiones sobre ChatGPT aplicado a la investigación, tras su reciente lanzamiento a finales de 2022. Asimismo, quiero agradecer al Cisepa, que poco después acogió mi propuesta de dictar un Taller Introductorio al Análisis Social de Datos Cualitativos usando Inteligencia Artificial y por el apoyo recibido durante cada reedición de este curso de extensión. Los procedimientos que aquí se presentan se beneficiaron de los valiosos aportes y reflexiones de los estudiantes1 de pregrado y educación continua en los cursos mencionados, así como en el Taller de Procesamiento de Datos de la carrera de Sociología en el primer semestre de 2023. En particular, cabe destacar que la redacción de esta guía recibió la valiosa asistencia del estudiante Piero Beretta Vidal. Asimismo, se añade un especial agradecimiento a la Facultad de Ciencias Sociales, en particular a la decana doctora Fanni Muñoz, por el apoyo recibido para la publicación de mi manuscrito. Por último, corresponde destacar que la presente guía práctica está compuesta de cuatro capítulos y una sección de reflexiones y consejos finales. El primer capítulo presenta la estrategia meto- dológica Aexco, en el marco de la cual se desarrollan los procedi- mientos de esta guía, así como los planteamientos éticos esen- 1 En la redacción de este documento, se buscaron términos neutros e inclusivos, no obstante, cuando fue necesario, como aquí, se usó el género masculino para hacer referencia a todas las personas de una población, independientemente de sus características individuales. 19 Prólogo ciales para el uso de ChatGPT en el análisis de datos. El segundo desarrolla los primeros pasos en el uso del programa ChatGPT, así como el importante entrenamiento CORI-F (contexto, rol, informa- ción y formato). El tercer capítulo brinda una presentación sobre la exploración de datos cualitativos y, posteriormente, guía al lector en la aplicación de dos técnicas básicas, paso a paso. Asimismo, provee un análisis de las fortalezas y debilidades identificadas en cada técnica. El cuarto capítulo introduce los principios de la codificación como proceso analítico, y, más adelante, propone al lector dos técnicas básicas para iniciar la clasificación del conte- nido cualitativo. Al igual que el capítulo anterior, brinda un análisis de las fortalezas y debilidades identificadas en ambas técnicas. Finalmente, como se ha anotado, se presenta un conjunto de re- flexiones y consejos finales para ser más creativos, eficientes y responsables en el uso de la IA para el análisis de datos cualitati- vos. Introducción 21 Capítulo 1 La estrategia Aexco y el uso ético de ChatGPT 1.1. Apuesta metodológica La apuesta metodológica de esta guía se inspira libremente en la teoría enraizada o teoría fundamentada (del inglés, Grounded theory) a través de autores como Barney Glaser y Anselm Strauss (2006) y Kathy Charmaz (2014). Sin embargo, también se basa en la práctica heterodoxa de análisis de datos cualitativos y en la búsqueda de perspectivas de utilidad multidisciplinaria (Elder y Giele, 2009; Creswell y Poth, 2016; Etesse, 2019). De hecho, se ha nutrido de la práctica investigativa y la enseñanza de metodología en disciplinas como Educación, Antropología, Sociología y Ciencias Políticas. En este sentido, cuatro elementos esenciales dan forma a la apuesta metodológica de esta guía. En primer lugar, un interés par- ticular por contenidos textuales no estructurados, es decir, que no poseen una estructura estandarizada (como sí existe en los datos cuantitativos), como transcripciones de entrevistas, grupos foca- les, canciones, discursos y sesiones de clase. En segundo lugar, se busca fomentar el descubrimiento de elementos nuevos, que 22 Introducción al análisis de datos cualitativos con inteligencia artificial difícilmente pueden ser advertidos durante el trabajo de campo o tras una relectura inicial de los datos. En tercer lugar, se quie- re responder a preguntas específicas de investigación por medio de conceptualizaciones, por lo que se fomenta la abstracción y la comparación. Finalmente, se establecen vínculos claros entre el resultado del análisis y los datos primarios por medio de procedi- mientos que aseguran su trazabilidad y transparencia. De esta apuesta metodológica surge la estrategia analítica lla- mada Aexco. Antes de profundizar en ella, es importante conside- rar la fase de diseño de investigación. En esta etapa, las preguntas específicas definen la orientación, responsabilidad que recae en el investigador. La formulación de tales preguntas, más detalladas y precisas que la pregunta general, requiere una atención minuciosa, ya que el investigador debe ser plenamente consciente de sus im- plicancias, dado que esta fase de diseño es fundamental al orientar las decisiones metodológicas a lo largo del estudio. En este sen- tido, se sugiere que cada pregunta específica de investigación se sitúe con claridad en tres dimensiones clave (Gibbs, 2008; Creswell y Poth, 2016): el tipo de razonamiento predominante (inductivo o deductivo), el tipo de evidencia predominante a analizar (objetiva o subjetiva) y el enfoque principal de descubrimiento (nomotético o idiográfico). Con preguntas específicas de investigación claras y precisas, el investigador podrá tomar decisiones metodológicas coherentes, efectivas y particulares en las fases de preparación, recolección y generación de datos; registro y transcripción de in- formación; así como en el análisis e interpretación de los datos. La estrategia Aexco propone generar descubrimiento y análisis útiles a través de tres procesos: la anotación, la exploración y la codificación. Cabe recordar que la efectividad de esta estrategia se basa en su orientación a responder preguntas específicas de 23 1. Estrategia y uso ético investigación planteadas con claridad y precisión. Esta estrategia proporciona una orientación práctica sobre la organización e in- terpretación de datos cualitativos, lo que resulta beneficioso para investigaciones que adopten enfoques diversos. En cuanto al primer proceso, la anotación, desempeña un papel esencial en el transcurso de la investigación al permitir a los investigadores registrar sus impresiones, reflexiones y decisiones en relación con los datos recolectados. Este proceso se erige como una práctica que facilita la exploración de datos, la identificación de patrones y tendencias emergentes, y la movilización de conceptos sólidos (Birks et al., 2008). Además, es un recordatorio constante de los objetivos de la investigación, lo que ayuda a mantener a los investigadores en el camino correcto a medida que avanzan en su estudio, así como a generar sinergias entre las diferentes etapas del trabajo de investigación. El segundo proceso, la exploración, es la práctica crucial para reconocer las características específicas al interior de los casos, y entre ellos, con la finalidad de identificar patrones y tendencias a partir de los elementos presentes en el material de estudio (Flick, 2014). Este proceso involucra una relectura minuciosa y una familiarización profunda con los contenidos, lo que implica no solo comprender su estructura, sino también evaluar su calidad y destacar las particularidades significativas. Durante esta fase, se inicia la búsqueda de contenidos y se trazan pistas analíticas que pueden resultar especialmente interesantes para responder a las preguntas específicas de investigación. Es así, principalmente, porque Aexco promueve nuevas formas de aproximarnos a nuestros datos, con apertura al descubrimiento, lo que allana el camino para una exploración más detallada y un análisis en profundidad de los datos recopilados. 24 Introducción al análisis de datos cualitativos con inteligencia artificial Por último, la codificación es un proceso de clasificación de segmentos de contenidos bajo uno o más códigos. Dicho de otra manera, este proceso implica seleccionar contenidos —detallados y situacionales— y asignarles conceptos o palabras más genera- les. Los códigos pueden predefinirse o surgir durante el proceso, según sea la orientación prioritaria de la pregunta específica de in- vestigación. La codificación suele realizarse en dos grandes ciclos (Saldaña, 2021): en el primero, se categorizan los datos en uno o más códigos; y en el segundo, se realiza una reorganización de los códigos con el fin de establecer ejes analíticos encaminados a una proposición final. En esta guía trataremos únicamente sobre el primer ciclo de codificación. La estrategia Aexco tiene un carácter tanto sistemático como flexible, ya que se basa en una práctica iterativa y concomitante. Así, como se aprecia en la figura 1.1, el mayor potencial analítico se alcanza a través de secuencias de continua retroalimentación Figura 1.1. Ilustración de la secuencia inicial de la estrategia Aexco para el análisis de datos cualitativos. 25 1. Estrategia y uso ético y retrospección entre anotación, exploración y codificación. Cabe señalar que esta guía se enfoca precisamente en los procesos de exploración y codificación de los datos cualitativos. 1.2. Uso ético de la inteligencia artificial Es importante destacar que el rol y el alcance de la IA en la inves- tigación social y educativa debe contemplar tales marcos regu- latorios institucionales y de carácter ético para promover un uso adecuado, pertinente y seguro de dicha herramienta. A pesar de que tales marcos se encuentran en pleno desarrollo, cabe destacar los lineamientos del Libro blanco sobre la IA: un enfoque europeo orientado a la excelencia y la confianza, publicado por la Comisión Europea (2020), en donde se hace hincapié en la ética, la privacidad y la seguridad en el uso de algoritmos para la toma de decisiones y la investigación. Asimismo, se debe considerar la Recomendación sobre la ética de la inteligencia artificial de la Unesco (2021), que promueve una reflexión normativa sistemática sobre el surgimien- to y la aplicación de la IA, reflexión basada en un marco integral, global, multicultural y evolutivo de valores, principios y acciones. Esta reflexión debe guiar el desarrollo y uso responsable de esta tecnología bajo principios que garanticen los derechos humanos, la privacidad, la protección de datos, la transparencia y la auditabi- lidad. Así como la atención a estos lineamientos y consideraciones elaborados por parte de entes internacionales, cabe señalar que el uso dado a las herramientas de IA debe realizarse a través de los estándares éticos de cada disciplina y del entorno académico y laboral específico en el que se desenvuelve el investigador. Dentro de los elementos principales en la discusión ética sobre el uso de la IA en la investigación, emerge la potencial autoría de la IA (Xames y Shefa, 2023). Sobre este punto, es importante establecer 26 Introducción al análisis de datos cualitativos con inteligencia artificial que, si bien ChatGPT se usa cada vez más en distintos procesos de la investigación, no ostenta estatus legal, por lo que tal programa no puede poseer derechos de autor ni ser sujeto de demanda ante posibles incidencias derivadas de la investigación (Committee on Publication Ethics, COPE, 2020). En particular, resulta clave indicar que ChatGPT no es un autor, y que la autoría solo puede recaer en el investigador, que asume toda la responsabilidad del tratamiento y de los resultados finales de la investigación. A la fecha, algunos editores, como es el caso de Springer-Nature, Elsevier, y Taylor & Francis, han fijado lineamientos para la inclusión del uso de la IA en la sección de metodología o sobre uso de herramientas (Rahman et al., 2023). En la misma línea, esta guía sugiere el señalamiento del uso de IA generativa en la sección de métodos al calificarse como una herramienta, al igual que otros programas tradicionales de análisis de datos. Por otra parte, aquí se considera fundamental que el investiga- dor adopte una postura clara en cuanto al rol de la IA en el proyecto de investigación. En particular, se asigna a ChatGPT el rol de herra- mienta de asistencia al análisis de datos cualitativos. La finalidad de esta herramienta será transformar información y producir insu- mos para enriquecer la mirada del investigador sobre los datos. En este sentido, resulta indispensable poseer un buen conocimiento previo de los contenidos a analizar con la ayuda de la IA. Teniendo en consideración estos elementos, la figura 1.2 pre- senta un diagrama de flujo para tomar la decisión de usar ChatGPT. Esta decisión implica estar apto para seguir el camino trazado con línea verde: primero, debe importar que el resultado sea verdadero; segundo, se requiere disponer de experiencia suficiente para ve- rificar que el resultado sea preciso; y, tercero, es necesario que el investigador esté dispuesto a asumir la completa responsabilidad por los resultados finales. Si él no está en condiciones de asumir 27 1. Estrategia y uso ético Figura 1.2. Diagrama de flujo para el uso seguro de ChatGPT. Fuente: Sabzalieva y Valentini (2023; diseño de Aleksandr Tiulkanov; rediseño de Fraidy Alonso Alzate Pamplona; bajo licencia de Atribución CC BY; fuente: Al and Data Policy Lawyer). todas y cada una de estas tres condiciones, más vale no usar dicha herramienta para el análisis de datos sociales y educativos. 28 Introducción al análisis de datos cualitativos con inteligencia artificial Como se muestra en la figura 1.3., el trabajo de investigación debe desarrollarse bajo la idea de un circuito cerrado de informa- ción. Puesto que ChatGPT no será usado para acceder a informa- ción desconocida, es importante establecer que utilice únicamen- te la que se le proveerá. Ello cobra una relevancia mayor ante un uso cada vez más extendido de la IA generativa como motor de búsqueda de información que se desconoce. Esta guía no sugiere usar ChatGPT como motor de búsqueda, tampoco para consultar información teórica, metodológica o de otro tipo. Las preguntas o solicitudes que se hagan a la herramienta comprometerán única y exclusivamente los datos de la investigación que el investigador ya conoce bien. Así, el trabajo se centrará en que la herramienta transforme información que ya él ya conoce. En este sentido, el cir- cuito cerrado de información permitirá crear una actitud específica en el investigador con respecto a la herramienta. Figura 1.3. Circuito cerrado de investigación. 29 1. Estrategia y uso ético Dentro del ámbito de la investigación social y educativa, es de suma importancia establecer protocolos de manejo seguro de la información de personas, grupos y organizaciones. A la fecha no se tiene un conocimiento certero acerca del uso que ChatGPT da a los datos que le proveen los usuarios, por lo que resulta impres- cindible brindar datos anónimos. Así, toda la información sometida al análisis de IA debe ser previamente sometida a a un exhaustivo proceso de anonimización. Este procedimiento busca salvaguar- dar la identidad de los participantes y su confidencialidad, un pilar ético fundamental para garantizar la integridad de la investigación (PUCP, 2016). Cabe considerar que la cuidadosa gestión de la con- fidencialidad contribuye a respetar los derechos y la privacidad de los involucrados en un estudio, y en muchos casos fortalece la va- lidez de los resultados obtenidos. Se debe tener en cuenta que los resultados que da ChatGPT están lejos de ser siempre neutros y pertinentes. Esta herramienta posee sesgos basados en la forma en que ha sido programada, particularmente aquellos que reflejan los que tiene el equipo que la ha desarrollado. Diversos estudios recientes han detectado en ChatGPT sus tendencias y posturas, las cuales no evidencian la diversidad cultural, social y política que existe en las sociedades y grupos de personas alrededor del mundo (Hartmann et al., 2023; Rutinowski et al., 2023). Asimismo, existen serias limitaciones en la herramienta para tomar en cuenta contextos e idiomas diferen- tes a aquellos en los que ha sido desarrollada y entrenada (Gosh y Caliskan, 2023). Debido a ello, resulta importante que el investiga- dor establezca procedimientos minuciosos de supervisión, lo que incluye evaluar cada uno de sus resultados en términos de la per- tinencia, la coherencia y el contexto específico que es estudiado. 31 Figura 2.1. Página principal de ChatGPT. Capítulo 2 Preparar el análisis: obtención de una asistencia útil para mi proyecto 2.1. Primeros pasos: entrar a ChatGPT A continuación, se presentan de forma ilustrada los dos primeros pasos para comenzar a trabajar con ChatGPT: el registro y la ini- ciación del trabajo en la interfaz. Paso 1. Ingreso a la página web y creación de una cuenta Ingresamos a la web oficial de ChatGPT2 y creamos una cuenta gratuita (versión GPT 3.5). La figura 2.1 muestra la ventana de ini- 2 Ver https://chat.openai.com 32 Introducción al análisis de datos cualitativos con inteligencia artificial cio de ChatGPT. Para registrarnos, hacemos clic en Sign up y com- pletamos nuestros datos. Paso 2. Acceso a la interfaz Tras la creación de la cuenta, accedemos a la interfaz de Chat- GPT, donde encontraremos sus distintos componentes. Como nos muestra la figura 2.2 y los números en ella indicados, la interfaz se compone de: 1. La barra de indicaciones o prompts (en la parte inferior). Aquí escribimos los mensajes, indicaciones y solicitudes a la herra- mienta, que llamaremos de aquí en adelante prompts. 2. El historial de conversaciones o chats (en la franja lateral izquierda). Aquí se encontrarán repatriadas cronológicamente las conversaciones realizadas. 3. El botón para crear una nueva conversación o chat (en la franja lateral izquierda). Al hacer clic en este espacio se genera una nueva conversación. 4. El espacio de conversación (en el área central). En este espacio, se visualizan nuestros mensajes y las respuestas de ChatGPT. Figura 2.2. Interfaz inicial de ChatGPT. 33 2. Preparar el análisis 2.2. El entrenamiento CORI-F Resulta esencial configurar o «entrenar» a ChatGPT para mejorar su asistencia al análisis específico de nuestro proyecto de inves- tigación particular. Con ello, la herramienta podrá realizar un aná- lisis más valioso y preciso. Este entrenamiento consiste en esta- blecer ciertos parámetros clave para el tipo de trabajo que se le solicitará. De esta manera, para que la herramienta pueda generar resultados pertinentes, se deben proporcionar instrucciones ini- ciales acerca de la naturaleza y finalidades del trabajo a realizar (Zhang et al., 2023). Esto es importante porque un entrenamiento bien hecho influye significativamente en las respuestas de Chat- GPT, especialmente en lo que respecta a la exploración y la codifi- cación de datos. Esta guía propone el entrenamiento CORI-F como procedimien- to esencial clave para una preparación adecuada de la herramien- ta. Tal entrenamiento resulta de informar a la herramienta acerca de: el Contexto (C) del trabajo, su Objetivo (O), la adopción de un Rol (R), la forma de tratamiento de la Información (I) y, adicional- mente, las características del Formato (F) de la respuesta que se solicita. Este enfoque se inspira en la metodología R.O.C.E.F. (Hoyl, 2023), pero no se agota en ella, ya que incorpora la idea de un tra- bajo en circuito cerrado. En este sentido, el entrenamiento CORI-F surge como un método efectivo y especializado para la utilización adecuada de ChatGPT en la investigación de datos cualitativos. De esta manera, se establece un marco integral para guiar la interacción con ChatGPT al asegurar que se tenga claro el contexto de trabajo, los objetivos específicos (OE), el rol que debe adoptar la herramienta, el uso exclusivo de información conocida y el formato óptimo de salida. Llegados a este punto, cabe destacar que el 34 Introducción al análisis de datos cualitativos con inteligencia artificial establecer un entrenamiento inicial no implica la imposibilidad de solicitudes de reajuste de las respuestas y/o recordatorios acerca de los elementos básicos del proyecto. De esta manera, se permite que esta interacción desemboque en un virtuoso ajuste de resultados con respecto a nuestras necesidades particulares de investigación. Ejemplos de entrenamiento inicial C - Contexto La C en CORI-F se refiere al contexto, lo que implica proporcionar la fundamentación necesaria para abordar de manera pertinente el proyecto de investigación, esto es, que la herramienta contemple el marco de trabajo de los datos. Al respecto, se establecen al menos cuatro elementos clave de información: 1. Tipo de trabajo a realizar Ejemplos: investigación científica; análisis de información. 2. Tipo de datos a trabajar En este caso, datos cualitativos. Puede ser: transcripciones de entrevistas, clases o grupos focales. 3. Disciplina o enfoque disciplinario de estudio Ejemplos: sociología política; educación. 4. Ubicación geográfica y/o temporalidad Ejemplos: Perú actual; Argentina en 1996. La figura 2.3 muestra un ejemplo de este tipo de prompt. El prompt se puede formular también de otras formas y con diferentes temas de investigación. Por ejemplo: «Me encuentro 35 2. Preparar el análisis desarrollando una investigación universitaria en educación en el Perú. Para ello, tengo datos cualitativos, que son entrevistas a personas con discapacidad. Estos datos deben ser analizados para entender sus experiencias educativas y laborales». O - Objetivos La O de CORI-F se refiere a los objetivos, lo que implica especificar claramente los lineamientos que guían la investigación y, por ende, orientar el análisis con la dirección previamente establecida. Se recomienda trabajar con las preguntas específicas o los OE de investigación como punto de partida para los diferentes prompts que se realicen. La figura 2.4 presenta un ejemplo de prompt acerca del objetivo. Otro ejemplo podría ser el siguiente: «El primer objetivo especí- fico es analizar cómo las personas con discapacidad entrevistadas recuerdan su experiencia educativa a lo largo de las tres etapas: educación primaria, educación secundaria y educación superior». Figura 2.3. Prompt del contexto del trabajo. Figura 2.4. Prompt del OE del trabajo de investigación. 36 Introducción al análisis de datos cualitativos con inteligencia artificial R - Rol La R implica delimitar bien el rol que adoptará ChatGPT, lo que im- plica definir el papel que desempeña tal herramienta en el proceso de investigación. Esto ayudará a esclarecer su función, que debe estar centrada en la generación de insumos y la asistencia al in- vestigador principal. Un ejemplo de este tipo de prompt se ilustra en la figura 2.5. Una alternativa al prompt puede ser la siguiente: «Para este proyecto, tu rol será el de un analista en datos cualitativos que brinda asistencia en la investigación». I - Información La I es la sección información, la cual permite delimitar el conjunto de información que será utilizada en el diálogo con ChatGPT. Ello es esencial para establecer el ya mencionado circuito cerrado de información y utilizar únicamente los datos proporcionados por el investigador. Como se ha visto en el primer capítulo, trabajar úni- camente con los datos conocidos y anonimizados resulta esencial desde el punto de vista ético (ver sección 1.2). A continuación, un ejemplo de este tipo de prompt se ilustra en la figura 2.6. Figura 2.5. Prompt del rol en el trabajo de investigación. Figura 2.6. Prompt del uso de la información proporcionada a ChatGPT. 37 2. Preparar el análisis Consejo 1. Evalúa el entrenamiento por medio de preguntas Es útil realizar preguntas de validación a ChatGPT para ase- gurarnos de que comprende claramente lo que se requiere. Su respuesta nos permitirá, eventualmente, especificar o com- pletar nuestro prompt. Por ejemplo, tras indicar el entrenamiento CORI-F, es útil formu- larle las siguientes preguntas incluidas en las figuras 2.7 y 2.8. Figura 2.7. Confirmación de los prompts del contexto y objetivos. Una alternativa al prompt puede ser: «Para el análisis de los datos, debes usar únicamente la información que te suministraré a lo largo de la investigación». F - Formato de los prompts La sección F de CORI-F hace referencia al formato de prompts y se centra en brindar instrucciones específicas sobre la presentación de las respuestas generadas por ChatGPT. Esto garantizará que los resultados se entreguen de la manera más idónea en función de las necesidades del investigador. El formato de prompts abarca el tipo de lenguaje deseado, la presentación de resultados y la organización de los mismos. Por ejemplo, se puede requerir un lenguaje formal o informal, ordenado en una lista, una tabla, un párrafo, en guiones o en otras formas. En las siguientes secciones, se presentan ejemplos concretos que ilustran estos prompts sobre el formato para orientar de manera específica la generación de respuestas por parte de ChatGPT. 38 Introducción al análisis de datos cualitativos con inteligencia artificial Figura 2.8. Confirmación de los prompts del rol y el uso de la información. Adicionalmente, una alternativa útil es realizar algunas pre- guntas sobre lo que ha retenido ChatGPT tras el entrenamien- to. Para ello, la figura 2.9 presenta un ejemplo de pregunta ge- neral e incluye la respuesta de ChatGPT. Figura 2.9. Resultados de preguntas acerca del proyecto de investigación. 39 2. Preparar el análisis Consejo 2. ¡Usa los pulgares! ChatGPT permite que los usuarios le brinden retroalimentación a través de los pulgares que se ubican en la parte inferior de sus respuestas (figura 2.10). Esto es esencial para comprender la preferencia de los usuarios hacia las respuestas de ChatGPT. Los pulgares —uno hacia arriba, positivo; otro hacia abajo, negativo— moldean el aprendizaje de la herramienta, lo que impulsa mejoras en la calidad y relevancia de las respuestas generadas para nuestro proyecto. Figura 2.10. Ubicación de los pulgares de retroalimentación en la interfaz de ChatGPT. 41 Capítulo 3 Explorar mis datos paso a paso con ChatGPT 3.1. Primeros pasos: orientaciones básicas Objetivo El objetivo principal del proceso de exploración de datos cualitati- vos es conocer de forma más profunda nuestros datos y fomentar la generación de nuevas miradas acerca de los contenidos estu- diados. La exploración acoge impresiones acerca de los conteni- dos y admite lo que es «llamativo», ya que necesita apertura para descubrir cosas nuevas y encontrar caminos alternativos para aproximarnos a nuestros datos. Por estas razones, se recomienda abordar este proceso con una actitud abierta, receptiva y espon- tánea. Este proceso consta de dos aproximaciones distinguibles: casuística o intra-caso; y comparativa o inter-caso. En esta guía nos centramos en el primer tipo de aproximación, para el cual se presentan cuatro técnicas concretas. En la figura 3.1, se ilustra una forma de explorar datos cualitativos a través de una secuencia de cuatro preguntas. 42 Introducción al análisis de datos cualitativos con inteligencia artificial Técnicas Considerando estas interrogantes que guían nuestra mirada exploratoria a los datos, cabe presentar las cuatro técnicas concretas que tocamos en este capítulo. Si bien estas pue- den ser realizadas en cualquier orden, se recomienda hacerlo en el que aparece a continuación. Selección de citas llamativas Se basa en identificar segmentos que nos resultan particular- mente interesantes por su significado, composición, contexto o alguna otra razón que no necesariamente logramos explicar. 1. ¿Qué es llamativo? Es importante adoptar una mirada intuitiva y sensible de aquello que nos parece interesante a primera impresión. Debemos examinar tanto el contexto como el contenido de los datos para identificar elementos que destaquen o llamen nuestra atención. 2. ¿Por qué es interesante? Una vez que hemos identificado elementos llamativos y hemos dado rienda suelta a nuestro interés espontáneo, debemos preguntarnos por la fuente de ese interés. 3. ¿Qué me está diciendo? Se debe examinar la singularidad de cada caso y comprender, específica- mente, los elementos de interés que emergen en estas primeras miradas a nuestros datos. 4. ¿Cómo puede aportar al proyecto? Finalmente, resulta esencial vincular el segmento de contenido con el plan- teamiento de mi proyecto de investigación, como las preguntas y los objeti- vos específicos. Figura 3.1. Secuencia de preguntas motivadoras para la exploración inicial de datos cuali- tativos. Fuente: elaboración propia, libremente inspirada en Richards (2015). 43 3. Explorar mis datos Buscamos seleccionar algunas citas llamativas en todos nues- tros documentos analizados, para lo cual preguntamos: ¿Qué expresiones resaltan? ¿Qué segmentos parecen importantes para el emisor del mensaje? ¿Qué citas representan mejor cada caso? Síntesis casuística Es el procedimiento de creación de resúmenes que, de forma concisa, reflejen la información considerada importante para cada caso. Así, para cada uno podemos realizar una síntesis de aquello que nos ha llamado la atención espontáneamente como investigadores o, alternativamente, sintetizarlo en base al interés de nuestras preguntas específicas de investigación. Dos preguntas pueden ayudar a este procedimiento de síntesis: ¿Cómo se podría condensar este caso? ¿Qué elementos impor- tantes son específicos de este caso? Recurrencia de términos Está basada en el conteo del uso de ciertos términos o pala- bras dentro de un texto estudiado. Se trata de una exploración léxica para trazar primeras pistas de semejanzas, patrones y/o temas recurrentes. Dos preguntas que pueden guiar este pro- cedimiento son: ¿Cuáles son las palabras o expresiones que se repiten más en este caso? ¿Existen términos que se repiten más al tratar ciertos temas o en ciertos momentos del texto? Constatación de inconsistencias Implica poner en perspectiva diferentes segmentos del texto para identificar incongruencias o incoherencias al interior de cada caso. Se trata de un procedimiento de triangulación que permite descubrir la lógica de la articulación de los contenidos textuales en un nivel más detallado. Dos preguntas que po- 44 Introducción al análisis de datos cualitativos con inteligencia artificial demos hacernos para emprender esta forma de explorar son: ¿Existe coherencia al interior de las diferentes partes del texto? ¿Por qué parece haber incongruencias en este caso? Exploración e inteligencia artificial Antes de empezar a explorar, es importante que estemos familiari- zados con los contenidos de interés, es decir, asegurarnos de que comprendemos su estructura, características y limitaciones. Para ello, debemos leer detenidamente todos los contenidos al menos una vez. En caso de que se haya realizado una transcripción, an- tes de comenzar el trabajo de exploración es importante confirmar la calidad de la gramática, ortografía y puntuación de los textos. El potencial heurístico del proceso de exploración se incrementa considerablemente cuando conocemos previamente los conteni- dos y estos han pasado por una revisión de forma. La IA puede ser una herramienta de gran utilidad para com- plementar el trabajo exploratorio del investigador, ya que, utiliza- da de forma adecuada, potenciaría el valor heurístico del proceso. En este sentido, el mayor valor que brinda trabajar con ChatGPT es la generación de insumos que enriquezcan, complementen y evalúen lo que el investigador elabora previamente. Para ello, se debe considerar que, para cada técnica de exploración, pediremos a ChatGPT que nos brinde insumos específicos que complementen aquellos que como investigadores hemos elaborado previamente. Caso ilustrativo En este capítulo, trabajaremos con el proyecto «Discursos presi- denciales» como caso ilustrativo para la explicación de cada una de las cuatro técnicas descritas. Como se detalla en la tabla 3.1, se trata de un proyecto cuyo objetivo es explicar cuáles fueron los aspectos prioritarios en la visión de país y su situación en los discursos de investidura ante el Congreso de la República de los 45 3. Explorar mis datos últimos presidentes peruanos. Aquí se utilizará el OE1 para reali- zar la exploración de datos cualitativos. Asimismo, del conjunto de casos estudiados, se utilizará uno en particular, presentado en el recuadro 3.1, para ilustrar los procedimientos de cada técnica de exploración. Recuadro 3.1. Caso ilustrativo: Discurso presidencial de un expre- sidente peruano Recibo con humildad y profundo fervor patriótico el cargo de presidente de la República. Declaro ante el Congreso, ante los presidentes amigos aquí reunidos y ante el pueblo peruano que, fiel al mandato de las urnas y en pleno respeto al Estado de Derecho, dedicaré toda mi energía a sentar las bases para que borremos definitivamente de nuestra historia el lacerante rostro de la exclusión y la pobreza construyendo un Perú para todos, atento siempre, en los más frágiles de nuestros hermanos. Exigiré el mismo compromiso y la misma energía a todo el equipo que me acompaña en el Ejecutivo. La democracia peruana será plena cuando la justicia y la paz social, la soberanía nacional y la seguridad de nuestras familias constituyan el zócalo de nuestra Nación, cuando la igualdad sea patrimonio de todos y la exclusión social desaparezca aun en los lugares más remotos del país. Tabla 3.1. Términos del proyecto de investigación «Discursos presidenciales» Pregunta general ¿Cuáles son los elementos esenciales de la visión de país que expresaron los presidentes peruanos en su primer mensaje presidencial? Objetivo general Explicar cuáles fueron los aspectos prioritarios en la visión de país y su situación en los discursos de inves- tidura de los últimos presidentes. Pregunta específica 1 ¿Cómo se aborda la crisis política y los principales problemas que aquejan al país? Objetivo específico 1 (OE1) Comprender la forma en que los últimos presidentes plantean los principales problemas y crisis política que enfrenta el país. 46 Introducción al análisis de datos cualitativos con inteligencia artificial Queremos que la expresión misma de «exclusión social» se borre para siempre de nuestro lenguaje y de nuestra realidad. Asumiré este reto con mi palabra y con mi vida. Hace casi un siglo, en 1914, Víctor Andrés Belaunde, uno de los grandes intelectuales y políticos del siglo XX, al terminar un discurso en la Universidad Nacional Mayor de San Marcos, lanzó a los jóvenes una proclama que era, al mismo tiempo, un grito de batalla y una demanda: ¡Queremos patria! Esta proclama años después fue recogida por José Carlos Mariátegui y Víctor Raúl Haya de la Torre para convertirla en pensamiento y acción. Esa reivindicación de la patria y de la Nación ha sido, como ahora, el sueño encendido de generaciones y de pueblos. Desde la fundación de la República, la patria constituye una aspiración al destino común, una esperanza, una promesa inacabada por la que el pueblo peruano ha estado siempre dispuesto a entregar su vida en la paz y en la guerra, para defenderla y para legarla a sus hijos con orgullo y con fe. La patria es nuestra Historia común, es el espacio donde todos los peruanos y peruanas queremos vivir en paz y en democracia. Por ello todos nos sentimos orgullosos de nuestra bandera, símbolo de nuestras luchas y de nuestro amor a la paz. Esta aspiración a una patria inclusiva es la que abre el camino al progreso social. Para hacerla posible nos presentamos ante el pueblo y por eso estamos aquí. Asumo este reto como un desafío y como una promesa que expreso hoy ante todos los peruanos, y especialmente ante mis hijos y ante todos los niños y niñas del país, que serán el futuro de esta nación. Este es nuestro patrimonio más rico. Por ellos y para ellos voy a cumplir mi promesa de hacer de este país un lugar donde todos disfruten del mismo derecho a la plenitud y a la felicidad, a una vida digna y a una vejez protegida. Peruanas y peruanos: el cinco de junio una mayoría de ciudadanos expresó su deseo de que el crecimiento económico y la inclusión social marchen juntos para transformar nuestro país en una patria de oportunidades para todos. El incremento desmedido de los conflictos, muchos de ellos absurdamente violentos, nos demuestra, día a día, que es urgente reparar las injusticias, corregir el rumbo y restablecer el diálogo en nuestra sociedad. El Perú es un país plurilingüe y multicultural. Esta múltiple diversidad constituye sin duda nuestra mayor riqueza. Sin embargo, durante mucho tiempo ha existido un discurso y una práctica de la exclusión, del rechazo a 47 3. Explorar mis datos la diferencia, un «tú no eres igual que yo», que cobijó la discriminación y la intolerancia. Esto resulta cuando menos extraño porque los comportamientos excluyentes provienen muchas veces de quienes elogian nuestra diversidad cultural. Pero precisamente esa diversidad cultural proviene de entender que nuestra nación es un crisol de razas y tradiciones. Son ellas las que sustentan, por ejemplo, nuestra extraordinaria gastronomía, hoy admirada y reconocida en el mundo. Porque somos diferentes, pero iguales en el fondo, labramos nuestra existencia en el trabajo y en el esfuerzo cotidiano. Somos mezcla y creatividad. Somos imaginación y trabajo. Y esta diversidad, que queremos integradora y no marginadora, constituye el fundamento de nuestra riqueza. Nuestro país trabajador, honrado y diverso se encuentra fracturado y herido. Sufre el abandono de los políticos y de un Estado insensible, burocrático y centralista. Un Estado que le ha dado la espalda al interior del país, un Estado que sufre de «mal de altura» o «soroche» y que se niega a subir los Andes y extenderse en nuestra Amazonía. Un Estado acechado por la corrupción y el despilfarro, alejado de sus ciudadanos, incapaz de protegerlos de la violencia y la criminalidad. Sueño con un Perú donde la vida no sea un riesgo, donde las ciudades sean espacios seguros, donde el ciudadano se encuentre protegido. Para esto necesitamos más Estado, más patria, y que la corrupción sea sancionada. La democracia expresó en las urnas un mandato y ese mandato debe ser honrado. Restablecer el valor de la palabra empeñada ante el pueblo constituye el eje de la recuperación de un sistema de valores éticos inherentes a la República. Sin embargo, transformar el país no es tarea fácil. No solo porque el cambio es siempre una tarea de multitudes, sino porque también implica enfrentar y superar nuestros problemas, proponer una nueva manera de convivir. La realidad exige transformaciones para que la igualdad, la tolerancia, el reconocimiento de nuestra diversidad y un desarrollo que nos incluya a todos sean, al mismo tiempo, un acto civilizatorio y un compromiso colectivo. La realidad nos interpela diariamente y nos exige un nuevo contrato social que haga posible la convivencia armoniosa de todos los peruanos. Evoco aquí nuevamente la figura de Haya de la Torre y su legado, plasmado singularmente en la Constitución de 1979, que constituye para mí una verdadera inspiración por su contenido nacional, democrático y de 48 Introducción al análisis de datos cualitativos con inteligencia artificial libertad. El gran Nelson Mandela, en un célebre discurso pronunciado en el marco de la Unesco, afirmó, con la convicción que lo caracterizaba, que la igualdad, la equidad económica y la justicia social eran la base de toda democracia. Él dijo: «No hay democracia con miseria, no hay democracia con asimetrías sociales». Y porque creo en la justicia de esta frase, yo he jurado respetar y defender la democracia. Fortalecerla en sus valores igualitarios para hacerla legítima ante el pueblo y así será. El gobierno se propone reconocer y reivindicar a los tres millones de peruanos migrantes. Para empezar, mejoraremos la defensa consular de los peruanos en el exterior y rebajaremos el costo de las remesas mediante convenios que realizará el Banco de la Nación. Deseamos que quien desea regresar a su patria lo haga y para ello fomentaremos que sea sujeto de crédito. Los detalles de estas políticas aquí señaladas serán presentados por la Presidencia del Consejo de Ministros, como corresponde, ante el parlamento. De la tradición militar, que no olvido y llevaré en el corazón hasta la muerte, conservo orgulloso la tenacidad, la austeridad y el amor por el Perú y sus intereses. En esa tradición, a diferencia de lo que piensan algunos, se sabe mandar, pero también obedecer, hay jerarquía, pero también fraternidad, hay disciplina, pero también intercambio de opiniones. Esa tradición se funde con el espíritu generoso del Perú, lejano al odio. No vengo en son de guerra sino en son de paz, sin venganza y sin rencor. Yo, que he sido acusado casi de todo, he aprendido a perdonar hace muchos años, antes incluso de hacer política. Por eso, a los que aún persisten en el encono, les pido que bajen sus espadas y sus lanzas. A los que demandan salarios y derechos, les digo que no bajen sus banderas, pero que sepan que todo cambio, para ser sostenible, debe ser gradual y racional. A mis partidarios, les pido consecuencia, lealtad, sacrificio, inteligencia y honradez. A la oposición, la llamo a la responsabilidad. Le pido vigilancia y que, desde su posición, respete también el mandato de las urnas, su mandato y el nuestro. Al terminar este mensaje, reitero que soy un soldado de la democracia. Y como dice la frase célebre de la Independencia: «Firmes y felices por la unión». ¡Muchas gracias a todo el país! ¡Viva el Perú! Fuente: Congreso de la República del Perú (2023). 49 3. Explorar mis datos 3.2. Técnica 1. Selección de citas llamativas Para realizar una selección de citas llamativas mediante el uso de ChatGPT, se siguen los pasos señalados a continuación. Paso 1 Iniciamos el entrenamiento CORI-F3 (figura 3.2). Figura 3.2. Entrenamiento CORI-F para la exploración. 3 Ver detalles y explicación sobre CORI-F en la sección 2.2. 50 Introducción al análisis de datos cualitativos con inteligencia artificial Paso 2 Una vez validado el primer paso, solicitamos a ChatGPT que rea- lice una selección de citas del discurso presidencial que le hemos proporcionado, como ilustra la figura 3.2. Esta solicitud debe estar acompañada del discurso completo4 (por motivos de espacio, en la figura se ha recortado). En cuanto al formato (la F de CORI-F), solicitamos que ChatGPT seleccione cinco citas y que incluya una breve explicación sobre su relevancia con el OE. Figura 3.3. Prompt para realizar la selección de citas relevantes.5 4 ChatGPT puede recibir hasta 3000 palabras, aproximadamente. 5 El discurso ha sido recortado por motivos de espacio. 51 3. Explorar mis datos A continuación, la figura 3.4 presenta la respuesta de ChatGPT al prompt. Figura 3.4. Resultados de la selección de citas relevantes en ChatGPT. 52 Introducción al análisis de datos cualitativos con inteligencia artificial La selección de citas obtenida por medio de ChatGPT puede ayudarnos a ubicar contenidos llamativos que podrían ser valiosos para nuestra exploración a la luz de nuestro OE de investigación. Resulta esencial que podamos verificar que las citas corresponden con el contenido de los datos provistos a la herramienta y que sus explicaciones sean coherentes. Asimismo, se recomienda enfáti- camente que los resultados generados por ChatGPT sean insumos para complementar una selección inicial realizada previamente por el investigador (durante la etapa de trabajo de campo, la trans- cripción o la relectura). Así, estos insumos pueden servirnos para mejorar nuestra selección de citas llamativas o para evaluar la que hemos realizado manualmente en un primer momento. Consejo 3. Recuerda frecuentemente el OE Si bien ChatGPT tiene la capacidad de recordar, su memoria no es excelente. Es por ello por lo que se recomienda reiterar con frecuencia un aspecto tan importante para una investigación como lo es el OE. De esta manera, se orienta mejor la respuesta de la herramienta y se obtienen insumos de exploración más precisos. Figura 3.5. Señalamiento del OE en el prompt del procedimiento de selección de citas.6 6 El discurso ha sido recortado por motivos de espacio. 53 3. Explorar mis datos 3.3. Técnica 2. Síntesis casuística Para realizar una selección de citas llamativas con el uso de Chat- GPT, se hace lo siguiente. Solicitar a ChatGPT elaborar un resumen corto del discurso. Para mayor precisión, recordamos el OE1. En cuanto al formato (la F de CORI-F), indicamos que se genere un párrafo de máximo cien palabras, como se ilustra en la figura 3.6. Figura 3.6. Prompt para realizar la síntesis casuística en ChatGPT.7 A continuación, la figura 3.7 presenta la respuesta de ChatGPT al prompt. Figura 3.7. Resultados de la síntesis del caso por parte de ChatGPT. 7 El discurso ha sido recortado por motivos de espacio. 54 Introducción al análisis de datos cualitativos con inteligencia artificial La síntesis del caso obtenida por medio de ChatGPT puede ayudarnos a identificar elementos importantes que serían valio- sos para nuestra exploración a la luz de nuestro OE de investiga- ción. Es muy importante que leamos detenidamente y podamos confirmar que el resumen es coherente. Asimismo, se recomienda enfáticamente que los resultados generados por ChatGPT sean utilizados como insumos para complementar o mejorar la síntesis elaborada previamente por el investigador de forma manual. Así, los insumos brindados por ChatGPT pueden servir para evaluar y/o mejorar nuestra mirada del caso tratado. 3.4. Técnica 3. Recurrencia de términos Para realizar una identificación de recurrencia de términos me- diante el uso de ChatGPT, se realiza lo siguiente. Pedir a ChatGPT hacer un recuento de las palabras más fre- cuentes en el discurso. En cuanto al formato (la F de CORI-F), in- dicamos que se genere una lista de las palabras más recurrentes, como se ilustra en la figura 3.8. Figura 3.8. Prompt para realizar un recuento de las palabras más frecuentes en ChatGPT.8 8 El discurso ha sido recortado por motivos de espacio. 55 3. Explorar mis datos La figura 3.9 presenta la respuesta de ChatGPT a dicho prompt. Figura 3.9. Resultados del recuento de términos por parte de ChatGPT. El recuento de palabras obtenido por medio de ChatGPT ayuda a identificar la recurrencia de términos. Tal recuento podría ser aplicado a partes específicas del contenido o a su totalidad, como en el ejemplo previo. Es muy importante que leamos detenidamente y podamos confirmar que el resultado es coherente, por ejemplo, a través de búsquedas de palabras en otros programas. Estos insumos pueden servirnos para evaluar y/o mejorar nuestra mirada del caso tratado y comprender su singularidad a la luz de cada uno de nuestros OE. 3.5. Técnica 4. Constatación de inconsistencias Para realizar una constatación de inconsistencias mediante Chat- GPT, se hace lo señalado a continuación. 56 Introducción al análisis de datos cualitativos con inteligencia artificial Como muestra la figura 3.10, se solicita a ChatGPT que identifique las dos más grandes aparentes inconsistencias en el discurso en relación con el OE 1. Figura 3.10. Prompt para identificar inconsistencias en ChatGPT.9 Como resultado, la figura 3.11 presenta la respuesta de Chat- GPT al prompt. Figura 3.11. Resultados de la identificación de inconsistencias por parte de ChatGPT. La identificación de incongruencias con el uso de ChatGPT es útil para mirar en perspectiva diferentes segmentos del caso explorado. Ello puede aplicarse a la totalidad del contenido de un 9 El discurso ha sido recortado por motivos de espacio. 57 3. Explorar mis datos caso, como en el ejemplo previo, o a secciones específicas. Es muy importante leer detenidamente el resultado y evaluar su calidad, sobre la base de nuestro buen conocimiento de los contenidos tra- tados. Estos insumos podrían servirnos para evaluar y/o desarro- llar nuestra aproximación acerca de los vínculos entre diferentes secciones de un mismo caso, lo que nos permite enriquecer nues- tra triangulación de informaciones al interior de tal caso y descu- brir nuevas pistas de comparación a su interior. Consejo 4. Usa regenerate ChatGPT provee una opción que nos permite solicitar una nueva elaboración de la última respuesta que ha provisto: la opción regenerate, o regenerar. Como muestra la figura 3.12, al final de la respuesta se presenta esta opción que se activa con un solo clic en el botón correspondiente. El programa for- mulará de inmediato una respuesta alternativa a la primera dada. Esto nos puede llevar a obtener una mejor respuesta, una que se acerque más a la expectativa que se tenía al mo- mento de brindar la solicitud. Una vez creada esta nueva res- puesta, se mantendrá disponible la versión anterior, a la que se podrá acceder en el espacio de la respuesta. Figura 3.12. Opción regenerate en ChatGPT. 58 Introducción al análisis de datos cualitativos con inteligencia artificial 3.6. Evaluación de los resultados En esta última sección del capítulo 3, se presentan una evaluación de los resultados que nos ha proporcionado ChatGPT a partir del proyecto «Discursos presidenciales». Se trata de un ejemplo ilus- trativo de los elementos a tomar en consideración en una evalua- ción crítica de esta herramienta. Las capacidades de este programa se encuentran en constante evolución, y sin duda seguirán en crecimiento en cuanto a desem- peño. Sin embargo, es preciso rendir cuenta de su estado actual. La tabla 3.2 presenta, para cada una de las técnicas usadas, algu- nos elementos de la evaluación realizada a los insumos generados en términos de fortalezas, debilidades y eficacia. Esta evaluación no es exhaustiva y busca principalmente llamar la atención acerca de la importancia de mirar de forma crítica cada procedimiento en el trabajo con IA. En la tabla 3.2, el primer aspecto, las fortalezas, subraya el valor que aporta la herramienta en función del tipo de procedimiento que se le pidió. Por ejemplo, podemos constatar que ChatGPT tiene un mejor desempeño en la síntesis de textos que en la identificación de inconsistencias. El segundo aspecto, las debilidades, hace explícitas las limitaciones encontradas para cada técnica. Por ejemplo, hallamos que la recurrencia de términos tiene mayores limitaciones, como la identificación de sinónimos, que la selección de citas llamativas. Por último, la eficacia es un puntaje que valora los resultados de las técnicas de exploración sobre la base de los resultados. Notamos que, a partir de los prompts presentados aquí, ChatGPT es más eficaz en la selección de citas llamativas y en la síntesis casuística. 59 3. Explorar mis datos Tabla 3.2. Evaluación del desempeño de ChatGPT en la exploración de datos cualitativos Técnica Fortalezas Debilidades Eficacia Selección de citas llamativas - Presentación de variedad de posibles citas llamativas. - Elaboración de explicaciones vinculadas con los OE de ayuda. - La falta de contexto específico puede generar ciertas citas con poca relevancia y precisión. 4/5 Síntesis casuística - Muy rápido procesamiento de grandes volúmenes de texto. - Resúmenes adecuados y pertinentes. - Algunos resúmenes tienden a ser muy generales y no siempre se ajustan al OE. 4/5 Recurrencia de términos - Realización de un recuento preciso de las palabras. - Dificultad para contabilizar correctamente sinónimos. - Limitaciones por el idioma y las expresiones del contexto específico. 3/5 Identificación de inconsistencias - Identificación de patrones iniciales y detalles específicos que podrían pasar desapercibidos en una revisión superficial. - La identificación de inconsistencias puede variar significativamente en calidad. - La presencia de sesgos inherentes al modelo puede afectar la objetividad en la identificación de patrones. 3/5 60 Introducción al análisis de datos cualitativos con inteligencia artificial Consejo 5. Haz una retroalimentación a ChatGPT Hacer una retroalimentación por escrito a ChatGPT, con el prompt de mejora, ayudará a que se elabore una nueva versión ajustada de la exploración específica. Para ello, puedes dete- nerte un momento y considerar qué fortalezas y debilidades has encontrado en ChatGPT. En relación a lo anterior, y como se ha visto en los consejos 2 y 4, es oportuno utilizar los pulgares y la opción regenerate para evaluar los resultados y mejorar futuras elaboraciones; asimismo, respecto a los consejos 1 y 5, que ayudan a obte- ner mejores resultados, es importante recordar el OE y realizar prompts que tengan una estructura ordenada. 61 Capítulo 4 Codificar contenidos paso a paso con ayuda de ChatGPT 4.1. Primeros pasos: orientaciones básicas Objetivo La codificación desempeña un papel crucial en el análisis de datos cualitativos. Tras la exploración inicial, ella se convierte en el me- dio para categorizar, comparar e interpretar nuestros datos (Char- maz, 2014). Este proceso implica clasificar segmentos de texto mediante el uso de palabras clave o «códigos». Estos pueden ser muy descriptivos o más abstractos —como nociones o concep- tos—. El uso de ambos tipos de códigos, y su posterior estudio, revisión y relacionamiento, permite una comprensión más integral y profunda de los datos. El proceso de codificación se divide en dos ciclos. En el pri- mero, se lee rápidamente los contenidos ya conocidos y se com- para constantemente los contenidos intra- e inter-caso (Glaser y Strauss, 2006) con el objetivo de asignar códigos a los seg- mentos de texto. El movimiento rápido a través de los datos es importante porque ello fomenta el encuentro de similitudes en los contenidos de diversos casos, es decir, impulsa la transversali- 62 Introducción al análisis de datos cualitativos con inteligencia artificial dad (Charmaz, 2014). En este sentido, la codificación nos brinda la posibilidad de trascender la mirada casuística. Posteriormen- te, en el segundo ciclo de codificación, se procede a releer los contenidos codificados, por caso y por código, para armonizar los códigos generados. Así, en esta segunda etapa se realizan los cambios necesarios —como fusión, eliminación, agrupación o creación de familias de códigos— para alcanzar un entendimien- to mayor de lo que nos dicen los datos (Saldaña, 2021). Del mis- mo modo, en esta etapa se crean categorías más amplias y se busca comprender sus relaciones subyacentes. En esta guía nos concentramos en la codificación durante el primer ciclo, para la cual se presentan dos técnicas concretas. Técnicas de codificación La forma que toma el proceso de codificación depende del tipo de enfoque en la elaboración de códigos. Para ello, existen dos téc- nicas principales, cada una de las cuales responde a tipos de ra- zonamiento diferentes: la deducción y la inducción. Mientras que el razonamiento deductivo parte de hipótesis basadas en la teo- ría y en conceptos escogidos cuidadosamente para analizar una realidad, el razonamiento inductivo parte de temas de interés y se concentra en las particularidades del contexto estudiado para, posteriormente, interpretar por medio de conceptos y construcción de hipótesis. Lo importante a tener en cuenta es que la elección de la técnica idónea debe basarse en la naturaleza del OE al que se apunta. A continuación, se presentan las dos técnicas de codifica- ción mencionadas. Codificación predefinida Sigue un razonamiento deductivo, por lo que se establece un repertorio de códigos en función de las hipótesis planteadas durante la formulación del proyecto de investigación. Dichas 63 4. Codificar contenidos hipótesis están respaldadas por un desarrollo teórico que pre- cede a la fase de análisis de datos. En el contexto de una in- vestigación social o educativa, para probar la validez de las hipótesis de trabajo, resulta necesario plasmar sus elementos constitutivos en el instrumento de recolección de datos (guía de entrevista o de observación, matriz de sistematización de documentos o informaciones, guion de grupo focal, entre otros). En este sentido, para el caso de una guía de entrevis- ta, por ejemplo, las preguntas contendrán información valiosa para la elaboración de los códigos. En esta técnica de codificación, se busca clasificar los conteni- dos en función de los códigos que hemos creado, los cuales, a su vez, provienen de los elementos constitutivos de las hipóte- sis de la investigación. Codificación emergente La codificación emergente sigue un razonamiento inductivo cuya orientación es adaptarse a lo que dicen los contenidos y crear códigos en función a lo que dicen los datos. No obstante, esta «libertad» para crear códigos según lo que emerge de los textos debe enmarcarse en los temas de interés delimitados en los objetivos de investigación. En investigaciones sociales y educativas, esta técnica sirve para rendir cuenta de la rea- lidad específica de cada contexto, persona o grupo analizado, lo que permite que aspectos propios que caracterizan a cada uno sean fuentes de abstracción. En este sentido, la principal fuente de generación de códigos no son los planteamientos de la investigación, sino los significados e informaciones de los datos mismos. Esta direccionalidad tiene mayor apertura al descubrimiento de procesos y relaciones no contempladas por el investigador. 64 Introducción al análisis de datos cualitativos con inteligencia artificial Codificación e inteligencia artificial Antes de empezar a codificar, resulta esencial que estemos fami- liarizados con los contenidos. Por lo general, se empieza a codifi- car después de haber realizado exploraciones de nuestros datos y de tener insumos acerca de las características de nuestros casos. De hecho, si desarrollamos una codificación emergente, tras la ex- ploración tendremos muchas ideas de posibles códigos porque ya conocemos bien el material estudiado. Por otra parte, si realiza- mos una codificación predefinida, habremos identificado bastante contenido que es susceptible de ser codificado con este o aquel código de nuestro repertorio. En este sentido, el potencial analítico de la primera fase de codificación es mucho mayor cuando se ha explorado previamente los contenidos, más aun si se ha elegido utilizar responsablemente insumos generados por la IA. La IA puede ser una herramienta de gran utilidad para comple- mentar el trabajo de codificación por su capacidad de añadir valor analítico al proceso. Así, lo beneficioso de trabajar con ChatGPT es generar códigos que enriquezcan y complementen las elaboracio- nes que el investigador ha realizado previamente. En este proceso se recomienda también realizar una primera ronda manual, y pos- teriormente pedir a ChatGPT insumos para que nuestra codifica- ción sea más creativa. Caso ilustrativo En este capítulo, trabajaremos con el proyecto «Trayectorias labo- rales y educativas de personas con discapacidad», notablemente desarrollado por las estudiantes Andrea Chávez, Daniela Neyra, Lorena Pacora y Nicole Vilca, como caso ilustrativo para la expli- cación de las técnicas de codificación predefinida y codificación emergente. Como se detalla en la tabla 4.1, se trata de un proyecto cuyo objetivo es comprender la visión que tienen las personas con 65 4. Codificar contenidos discapacidad acerca de sus trayectorias educativas y laborales en diversas regiones del país. Para este capítulo, trabajaremos única- mente con el OE1 de ese proyecto para realizar la codificación de entrevistas; para ilustrar la codificación predefinida, utilizaremos la guía de entrevista con la que se realizó la recolección de infor- mación, que puede ser consultada en la tabla 4.1; y, para ilustrar les procedimientos de codificación emergente, se utilizará un ex- tracto de entrevista, que se presenta en el recuadro 4.2. Tabla 4.1. Términos del proyecto de investigación «Trayectorias laborales y educativas de personas con discapacidad» Pregunta general ¿Cómo han sido las experiencias educativas y labora- les de las personas con discapacidad entrevistadas? Objetivo general Comprender la manera en que las personas con dis- capacidad entrevistadas ven su trayectoria educativa y laboral. Pregunta específica 1 Desde su experiencia como personas con discapaci- dad, ¿cómo han vivido su formación y su trayectoria educativa? OE1 Comprender cómo recuerdan su experiencia educati- va las personas con discapacidad entrevistadas. 66 Introducción al análisis de datos cualitativos con inteligencia artificial Recuadro 4.1. Guía de entrevista del proyecto «Trayectorias laborales y educativas de personas con discapacidad» Buenas tardes señor / señora _____________ Antes que nada, muchas gracias por su tiempo y disposición para realizar la entrevista. Voy a grabar la entrevista con el fin de tener registrada la información, pero esta solo se utilizará para fines académicos y todo se mantendrá de manera confidencial. ¿Está bien? Me llamo ______. Esta entrevista tiene como finalidad conocer un poco sobre su historia de vida en relación a su experiencia educativa y su experiencia en el mundo laboral. La entrevista no durará más de media hora. Antes de empezar, quisiera hacerle unas preguntas introductorias. Información personal ¿Cuál es su nombre completo? ¿Cuántos años tiene? ¿En dónde nació? ¿Cuál es su lugar de residencia? ¿Cuál es su profesión? ¿Cómo se compone la jefatura de su hogar? ¿Qué limitación o discapacidad física tiene? Experiencia educativa ¿Cómo ha sido su experiencia educativa? Durante su educación primaria e inicial, ¿el entorno era accesible y se acomodaba a su discapacidad? Durante su educación secundaria, ¿el entorno era accesible y se acomodaba a su discapacidad? ¿Me podría contar cómo fue su experiencia educativa después del colegio? ¿El entorno fue accesible y se acomodaba a su discapaci- dad? 67 4. Codificar contenidos ¿Tuvo usted formación en materias no académicas? ¿Cómo fue su educación en estas materias? ¿El entorno era accesible y se acomo- daba a su discapacidad? ¿Cómo era su relación con sus compañeros y compañeras? ¿Fue fácil hacer amigos? Experiencia laboral ¿Cómo ha sido su experiencia laboral? ¿Qué dificultades ha tenido para insertarse al mundo laboral? ¿Cómo fue la elección de su lugar de trabajo? ¿Fue la única opción para usted o lo escogió porque era el que se adecuaba mejor a sus necesidades? ¿Cómo era trabajar en ese lugar? ¿Cómo era su relación con sus compañeros? ¿El entorno era accesible y se acomodaba a su discapacidad? Recuadro 4.2. Fragmento de entrevista a Celia, proyecto «Trayectorias laborales y educativas de personas con discapacidad» D3. Celia (74-111) «… ella tiene que aprender a levantarse…» Yo, primaria, lo realicé en el colegio 463, que quedaba, bueno, que queda, ahora a dos cuadras y media, pero antes quedaba a una cuadra, nada más, de mi casa. Toda mi primaria. Mi secundaria lo realicé en el colegio San Lorenzo 7013, a dos cuadras de mi casa. O sea, prácticamente siempre…, mi mamá, como toda mamá sobreprotectora, siempre quiso buscar lo más cercano para que ella esté detrás mío, ¿no? Tratando de evitar de que pudiera suceder algo. Pero gracias a Dios… siempre he sido una persona muy independiente y esto, por ejemplo, se lo debo a mi profesora de primaria. Que ella 68 Introducción al análisis de datos cualitativos con inteligencia artificial nunca dejó de que yo fuera una persona con discapacidad y me sentara… Por ejemplo, en transición, mi profesora Valentina me sentaba en un rinconcito, en una mesita, a la puerta, justo al lado de la puerta de salida, para que yo no caminara nada. Había participación para salir adelante y escribir en la pizarra, no me sacaba. Yo siempre decía «¿pero por qué no me saca?», ¿no? Cuando paso a primer grado, en esa época vendría a ser pues el primer año… y con la que llevé hasta quinto de primaria, fue con la profesora Julia Torres. Ella… cambió totalmente lo que yo estaba acostumbrada, ¿no? A sentarme en un rinconcito, a no participar, y todo. Buscando la comodidad, entre comillas. Ella no, ella, al contrario. Me hizo sentarme adelante, cerca a su escritorio, y que participara a salir a la pizarra. Inclusive los primeros días yo le reclamaba «¿Por qué me saca a la pizarra si mi profesora el año pasado no me sacaba?». Ya. «No, porque tú no tienes corona. Tú tienes que salir igual que tus compañeros salen a la pizarra». Ella fue la que fue motivándome, ¿no?, que yo saliera, participara. Es más, me hizo desfilar… para el aniversario de Surquillo, toda la avenida Angamos. Y me hizo que yo fuera detrás de la persona que llevaba la bandera. «Tú vas a ir a paso lento, pero vas a marchar con nosotros». Primera vez en mi vida que hice eso. Y allí todo era… era yo, ¿no? La profesora me decía «Hay que hacer esto», «Quiero que te aprendas esta poesía», «Quiero que cantes esta canción». O sea, siempre ella. «Pero profesora…», le digo, «¿me voy a tener que memorizar toda esa poesía?». «Sí». Y ella era la que me motivaba, me preparaba. Me tomaba la lección y me decía «No, acá tienes que decirlo de esta forma, acá tienes que levantar más la voz, acá tu pausa». Y fue por ella, porque mi mamá no quería ni dejarme que fuera a los paseos. Y ella venía, como estaba a una cuadra de mi casa, venía y le decía «Señora, ¿por qué no quiere que ella vaya de paseo?». «No», le decía, «porque no vaya a ser que se caiga». «¿Y, señora? Toda 69 4. Codificar contenidos la vida usted no va a estar para ella. Ella tiene que aprender a caminar por sí sola. Si se cae, ella tiene que aprender a levantarse. Usted tiene que pensar en el mañana. Ella va a estudiar, se va a superar, se va a casar, va a formar su hogar, y usted no va a estar pues pegada a ella para todo». Y mi mamá, yo me acuerdo, le escuchaba decir «No… mi hijita nunca se va a casar», «No va a tener hijos», decía. «Señora», dice, «¡Por favor! Yo me la llevo y yo me voy a hacer cargo de ella». Y a partir de esa fecha mi mami, yo la veía ¿no? Por- que ella iba y veía que subía al bus, y lloraba, ¿no? Un poco que yo también me iba llorando, ¿no? Pero después ya no… Secundaria, ya mi vida era distinta, ¿no? Ya con las chicas participaba más, ya para todo era, ¿no? Las mismas chicas «Vamos a organizar tal cosa, ya pues, tú habla con la profesora». Bueno. O tal cumpleaños se ce- lebraba. «Habla con tu papá, que te dé chance en tu casa para que no… no te vayan a poner trabas y te digan “no vayas”, ¿no?». Y para qué, mi papá, mi mamá, muy asequibles, entonces ellos dejaban que ellos vinieran a la casa. Y todo eso, más… a un sacerdote, el padre Carlos, que en paz descanse. Desde que yo comencé a participar en la Fraternidad Solidaria de Salud, él siempre también me motivaba a ir a los paseos, a organizar, me ponía a cargo a los más pequeños, ¿no? Y luego empecé a tener cargos dentro de este grupo y esto es a nivel internacional. En cada distrito hay, o bueno, había, porque ahora también se ha desintegrado prácticamente, ¿no? Hay pequeños núcleos en cada distrito. Y en esa época, pues sí había en todos los distritos. Yo siempre tuve un cargo dentro del distrito de Surquillo, y poco a poco fue escalando, ¿no? Luego fue a nivel zonal, después a nivel de Lima, y en el de Lima comencé a trabajar con los niños porque gané un concurso en el mes de septiembre por el día de la 70 Introducción al análisis de datos cualitativos con inteligencia artificial primavera. Salí elegida reina, y la labor de la reina es trabajar todo un año con los niños. Todos los niños a nivel de Lima Metropolitana. Y de allí yo siempre fui escalando. Me presenté a la universidad, a la nacional porque en esa época pues todo era la nacional, ¿no? Y yo quería ser una sanmarquina. No ingresé. Eh, para esto, mi… en esa época, era enamorado de mi hermana, de mi segunda hermana, porque yo soy la mayor. En esa época eran solamente, bueno, eran enamorados, ahora ya son esposos, ¿no? Él me decía «Si no ingresas acá, preséntate a la [universidad] Villaflor. Ingresas a la Villaflor, espera al otro año, y vuelves», me dice. «En el intento está la vencida». Dicho y hecho. Me presenté a la Villaflor. No ingreso. Esperé al siguiente año. San Lucas, tampoco. Me presento a la Villaflor y yo me presenté por presentarme. Justo había habido una de mis operaciones de corrección del pie, estaba con yeso, y yo dije «No me voy a presentar». Pero mi cuñado fue, compró la carpeta de postulante, me lo trajo y me dijo «Tal día es tu examen, tienes que ir tal día, llevar tus papeles y todo. Yo te voy a venir a recoger, le voy a decir a mi papá que me preste su carro y te llevo». Me llevó enyesada y todo. Fui a dar el examen. Y al día siguiente… yo ni siquiera ya tenía ganas ni de recibir los resultados en el periódico. Y mi cuñado vino temprano y yo escuché que le dijo a mi mamá «Señora, ¿y ella?». «Ella todavía está durmiendo», le dice. «No, pero que se levante que hay que celebrar. ¡Ingresó!». ¡Había ingresado! Ingresé a la Villaflor a Psicología. Terminé de estudiar. Bueno actualmente soy egresada, porque justo cuando estaba por finalizar, ya había estado en internado, salí embarazada, ¿no? Salí embarazada de mi hija que actualmente ya tiene 26 años. Y entonces ya no pude seguir, pero sí terminé mi internado. Luego con eso… dije «Más adelante», pero eso del «más adelante» nunca se 71 4. Codificar contenidos dio, ¿no? Porque empezaba a juntar, «Voy a sacar esto, voy a sacar lo otro», ya se presentaba otra cosa, tenía que coger ese dinero. Ya había más necesidades para mi hija. Entonces, pensando en ella, fue lo que, ya luego, lo dejé de lado, ¿no? Lo dejé de lado. Y justo, mi hija cumplió un año, y tuvo una… un germen que le ingresó a ella a su organismo. Y un poquito se me va… Fuente: extracto de entrevista realizada por las estudiantes Andrea Chávez, Daniela Neyra, Lorena Pacora y Nicole Vilca en el Taller de Procesamiento de Datos de la PUCP (2022-1). Nota: tanto el nombre de la entrevistada como las referencias a lugar y personas fueron modificados. 4.2. Técnica 1. Codificación predefinida Para generar códigos deductivos, podemos tener la asistencia de insumos de ChatGPT a partir de los contenidos de nuestra guía de entrevista. Así, en vistas a formular códigos con el uso de ChatGPT, seguiremos los siguientes pasos. 72 Introducción al análisis de datos cualitativos con inteligencia artificial Paso 1 Se inicia con el entrenamiento CORI-F10 (figura 4.1). 10 Ver detalles y explicación sobre el entrenamiento CORI-F en la sección 2.2. Figura 4.1. Entrenamiento CORI-F para la codificación. Paso 2 Una vez validado el primer paso, solicitamos a ChatGPT que pro- ponga diez códigos a partir del contenido de la guía de entrevista, y señalando el OE, como se muestra en la figura 4.2. En cuanto al formato (la F de CORI-F), pedimos que cinco de los códigos sean descriptivos y que cinco sean conceptuales, y que se presenten en una tabla. Por último, especificamos que sean códigos de una sola palabra. 73 4. Codificar contenidos Figura 4.2. Prompt para la creación de códigos predefinidos en ChatGPT.11 La figura 4.3 presenta la respuesta de ChatGPT al prompt. Figura 4.3. Resultados de la codificación predefinida en ChatGPT. La lista de diez códigos elaborada por ChatGPT puede ayudar- nos mucho en nuestra codificación predefinida derivada del OE1 de investigación. Sin duda, como se ha dicho, es importante verificar la coherencia de los códigos, así como la pertinencia para su inclu- sión en nuestras listas de los mismos. Estos insumos generados 11 El discurso ha sido recortado por motivos de espacio. 74 Introducción al análisis de datos cualitativos con inteligencia artificial por la herramienta pueden servir para enriquecer o evaluar nuestra formulación de códigos mediante un razonamiento deductivo. 4.3. Técnica 2. Codificación emergente Para generar códigos inductivos, debemos brindar a ChatGPT los contenidos de nuestros casos de forma ordenada. Para ilustrar este procedimiento, usamos un extracto de la entrevista realizada a una persona con discapacidad, en la que ella narra sus vivencias durante su etapa escolar (recuadro 4.2.). Tras el entrenamiento CORI-F, que debe ser realizado al inicio del trabajo, se hace lo siguiente. Requerir a ChatGPT la creación de cinco códigos basados en los contenidos del fragmento de entrevista que concierne al OE1, como se muestra en la figura 4.4. En cuanto al formato (la F de CORI-F), pedimos adicionalmente que tres códigos sean descrip- tivos y que dos sean conceptuales, que tengan como máximo una palabra y que los resultados se presenten en una tabla. Figura 4.4. Prompt para realizar la codificación emergente.12 12 El discurso ha sido recortado por motivos de espacio. 75 4. Codificar contenidos A continuación, la figura 4.5 presenta la respuesta de ChatGPT al prompt. Observamos allí que los códigos descriptivos son «Ex- periencia escolar en primaria», «Influencia positiva de profesores» y «Apoyo familiar y resistencia»; y los códigos conceptuales, «In- dependencia» y «Superación». Figura 4.5. Resultados de la codificación emergente en ChatGPT. Los códigos emergentes obtenidos por medio de ChatGPT pue- den ser útiles para encontrar palabras clave que no se habían con- siderado previamente y ser buenas alternativas para comprender lo que nos dicen los contenidos. Esto enriquecería el trabajo de co- dificación emergente manual que hayamos realizado. No obstante, es de suma importancia la pertinencia de los códigos propuestos por la herramienta y que sus explicaciones sean coherentes. Estos insumos también pueden ser de gran utilidad para mejorar nuestra codificación emergente descriptiva y conceptual con el propósito de establecer patrones en nuestros contenidos. 76 Introducción al análisis de datos cualitativos con inteligencia artificial Consejo 6. El uso de formatos ordenados para la codificación En el marco de la codificación asistida por ChatGPT, se recomienda que los prompts incluyan la generación de tablas y que haya un prompt acerca de la extensión de los códigos. Las ventajas de hacer esto son múltiples: Un formato ordenado ayuda al modelo a entender mejor la es- tructura de la información y a generar respuestas más precisas. En procedimientos de abstracción, como la codificación, las tablas evitan la generación de respuestas dispersas o ambi- guas y mejoran la calidad general del resultado. Delimitar el número de palabras a una cantidad acodada permite que se refuerce la necesidad de establecer una abstracción a partir de los contenidos. Para el caso de los códigos conceptuales, se recomienda solicitarlos con un máximo de dos palabras. A continuación, la figura 4.6 ilustra la especificación para el formato. Figura 4.6. Indicar formatos para la codificación inicial en ChatGPT. 77 4. Codificar contenidos 4.4. Evaluación crítica de los resultados En esta última sección del capítulo, se presenta una evaluación acerca de los resultados que nos ha proporcionado ChatGPT a par- tir de un extracto de entrevista del proyecto «Trayectorias labora- les y educativas de personas con discapacidad». Las capacidades de la IA se encuentran en constante evolución, por lo que resulta importante reservar un espacio para reflexionar críticamente acer- ca de la calidad de los resultados que brinda, lo que nos permite identificar patrones —de eficacia e ineficacia— en el trabajo con ChatGPT. Esta evaluación no es exhaustiva y busca principalmente mostrar una forma de mantener una mirada crítica a cada procedi- miento realizado con IA. La tabla 4.2 presenta, para las dos técnicas aplicadas, un ejem- plo de la evaluación realizada a los insumos generados por Chat- GPT en términos de fortalezas, debilidades y eficacia. Las forta- lezas describen el valor que ha aportado ChatGPT. En este caso, obtuvimos códigos interesantes y pertinentes en una fracción de segundo, tanto con la codificación emergente como con la codifi- cación predefinida. Asimismo, se lograron buenos resultados en ambos procedimientos al solicitar códigos descriptivos y códigos conceptuales. En cuanto a las debilidades, estas rinden cuenta de las limitaciones identificadas al realizar las dos técnicas de codi- ficación, que se vinculan principalmente con la falta de entendi- miento contextual y con el idioma, así como con propuestas muy generales de códigos en algunos casos. Por último, la eficacia es un puntaje que valora los resultados de las técnicas de exploración sobre la base de los resultados, puntaje que en ambos casos fue bastante aceptable. 78 Introducción al análisis de datos cualitativos con inteligencia artificial Tabla 4.2. Fortalezas y debilidades identificadas en el proceso de codificación inicial con ChatGPT Procedimiento Fortalezas Debilidades Eficacia Codificación predefinida - Puede procesar preguntas de investi- gación, objetivos y/o guías de recolección de datos de manera rápida y consistente. - Puede proponer códigos útiles para la clasificación de contenidos y la identi- ficación de patrones y conceptos previos al análisis de contenido. - Puede no tomar en consideración ciertas preguntas o repre- guntas, debido a su formulación ambigua o excesivamente concisa. - Pueden generarse códigos muy genera- les, que no se ajustan completamente a la especificidad requeri- da para el análisis. 4/5 Codificación emergente - Puede procesar grandes volúmenes de texto(1) de manera rápida y consistente. - Puede identificar de forma eficaz patrones, temas o conceptos emergentes que po- drían pasar desaper- cibidos en enfoques más estructurados. - La identificación de patrones puede no ser tan profunda en cuestión de signifi- cados subyacentes e interpretaciones contextuales, en par- ticular en castellano del Perú. - Pueden generarse códigos conceptuales que no son lo sufi- cientemente precisos. 4/5 Nota: (1) La versión gratuita de ChatGPT tiene un límite de palabras, por lo que se puede trabajar por bloques de contenido. Por su parte, la versión pagada no tiene límite de pala- bras y soporta documentos (no se requiere pegar los contenidos en la ventana de diálogo). 79 4. Codificar contenidos Consejo 7. Haz una retroalimentación a ChatGPT Es importante hacer una retroalimentación por escrito a ChatGPT, con el prompt de mejora, lo que ayudará a que se elabore una nueva versión ajustada de los códigos propuestos. Para ello, puedes detenerte un momento y considerar qué fortalezas y debilidades has encontrado en ChatGPT. En relación a lo anterior, y como se ha visto en los consejos 2 y 4, es oportuno utilizar los pulgares y la opción regenerate para evaluar los resultados y mejorar futuras elaboraciones; asimismo, respecto a los consejos 1 y 5, que ayudan a obte- ner mejores resultados, es importante recordar el OE y realizar prompts que tengan una estructura ordenada. 81 Cierre: cinco consejos Cierre Cinco consejos para ser más creativos, eficaces y responsables al usar inteligencia artificial en la investigación social y educativa 1. Te estás aventurando en procedimientos novedosos, con una herramienta nueva. Por ello, asegúrate de hacerlo a partir de un diseño de investigación consistente y bien delimitado. Esto debe guiar la toma de decisiones en cada procedimiento y cada decisión metodológica. En particular, es muy útil que tengas permanentemente en consideración las preguntas y/o los ob- jetivos específicos en el tratamiento y el análisis de los datos. 2. Para muchas personas, el uso de ChatGPT es poco conocido e incluso, en algunos círculos, polémico. Por ello, antes de em- pezar a usar esta herramienta, tómate el tiempo de conocer los lineamientos éticos para su uso en la institución o instituciones con las que tienes un compromiso laboral o de otro tipo. A par- tir de esto, sigue los lineamientos y políticas de tu organización para el uso de IA en la creación de conocimiento y/o en el aná- lisis de datos. Del mismo modo, es conveniente transparentar el uso de IA cuando presentes las herramientas usadas en el análisis de datos cualitativos. 3. La meta de la investigación social y educativa es profundizar en el entendimiento de contextos específicos y construir conoci- miento e interpretación difícil de obtener a simple vista. La es- 82 Introducción al análisis de datos cualitativos con inteligencia artificial trategia Aexco, propuesta en esta guía, te permitirá vincular tus anotaciones, exploración de datos y codificación para generar sinergias y reflexiones novedosas sobre tus datos. En particu- lar, es importante que apliques las seis técnicas de exploración y codificación, ya qu