Evolución de la IA en la resolución de problemas contables: Comparación entre GPT4 y GPT4o en el Examen de Competencia Contable

dc.contributor.authorMachado de Freitas, Marcelo
dc.contributor.authorDutra Sallaberry, Jonatas
dc.contributor.authorBruno de Jesus Silva, Thiago
dc.contributor.authorSilva da Rosa, Fabricia
dc.date.accessioned2025-11-17T20:52:55Z
dc.date.issued2025-09-29
dc.description.abstractThe research aimed to evaluate the performance of the GPT-4o model compared to the GPT-4 model in solving questions on the Accounting Proficiency Exam. This study is grounded in the concept of natural language processing (PLN), as discussed by Brown et al. (2020). The research was conducted using the design science methodology, which aims to build and/or evaluate different technological artifacts by applying the proficiency exam questions to GPT-4o, using OpenAI's ChatGPT. While actual statistics for the Proficiency Exam show that only a portion of accountants pass, the results of artificial intelligence (AI) showed that all four editions evaluated passed with at least a 64% success rate. Overall, across the sample analyzed, the GPT-4o AI model achieved 77% accuracy compared to 71% for the GPT-4 model, achieving 84% accuracy in the last two exams using the most recent model. However, on some questions that the GPT-4 model had previously answered correctly, the more recent model ended up answering incorrectly or differently than expected by the question developers. These results contribute to the literature studying the use of AI in accounting, particularly the application of natural language processing models and large language models (LLMs).en_US
dc.description.abstractLa investigación tuvo como objetivo evaluar el rendimiento del modelo GPT-4o en comparación con el modelo GPT-4 en la resolución de preguntas del Examen de Competencia Contable. Este estudio se fundamenta en el concepto de procesamiento del lenguaje natural (PLN) de Brown et al. (2020). La investigación se realizó utilizando la metodología design science, que busca construir y/o evaluar diferentes artefactos tecnológicos aplicando las preguntas del Examen de Competencia al GPT-4o, utilizando ChatGPT de OpenAI. Si bien las estadísticas reales del Examen de Competencia muestran que solo una parte de los contadores lo aprueba, los resultados de la inteligencia artificial (IA) mostraron que las cuatro ediciones evaluadas aprobaron con al menos 64% de éxito. En general, en la muestra analizada, el modelo de IA GPT-4o alcanzó 77% de precisión, en comparación con el 71% del modelo GPT-4; así, se alcanzó un 84% de precisión en los dos últimos exámenes con el modelo más reciente. Sin embargo, en algunas preguntas que el modelo GPT-4 había respondido correctamente previamente, el modelo más reciente terminó respondiendo incorrectamente o de forma diferente a la esperada por los desarrolladores. Estos resultados contribuyen a la literatura que estudia el uso de la IA en contabilidad, en particular, en la aplicación de modelos de procesamiento del lenguaje natural y modelos de lenguaje extenso (LLMs).es_ES
dc.description.abstractA pesquisa teve por objetivo avaliar o desempenho do modelo GPT-4o em relação ao modelo GPT-4 na resolução de questões do Exame de Suficiência em Contabilidade. Esse estudo se caseia no conceito de processamento de linguagem natural (PLN) de Brown et al. (2020). A pesquisa foi operacionalizada com a metodologia de design science, que visa construir e/ou avaliar diferentes artefatos tecnológicos, mediante a aplicação das questões do Exame de Suficiência no GPT-4o, por meio do ChatGPT da OpenAI. Enquanto as estatísticas reais do Exame de Suficiência demonstram a aprovação de apenas uma parcela dos contabilistas, os resultados da inteligência artificial (IA) foram de aprovação em todas as quatro edições avaliadas com pelo menos 64% de aproveitamento.  No âmbito geral da amostra analisada, o modelo de IA do GPT-4o apresentou 77% de aproveitamento de respostas frente a 71% do modelo GPT-4, alcançando uma acurácia de 84% nos últimos dois exames pelo modelo mais recente. Ainda assim, em algumas questões que o modelo GPT-4 havia acertado, esse modelo mais atual acabou respondendo de forma equivocada, ou diferente do previsto pelos elaboradores das questões. Esses resultados contribuem para a literatura que estuda o uso de IA dentro do campo da contabilidade, em especial a aplicação de modelos de linguagem de processamento natural e large language models (LLMs).pt_BR
dc.formatapplication/pdf
dc.identifier.doihttps://doi.org/10.18800/contabilidad.2025ESP.005
dc.identifier.urihttps://revistas.pucp.edu.pe/index.php/contabilidadyNegocios/article/view/31895/28006
dc.identifier.urihttp://hdl.handle.net/20.500.14657/205111
dc.language.isopor
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.publisher.countryPE
dc.relation.ispartofurn:issn:2221-724X
dc.relation.ispartofurn:issn:1992-1896
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by/4.0
dc.sourceContabilidad y Negocios; Vol. 20. Edición especial 2025.es_ES
dc.subjectUse of technologiesen_US
dc.subjectChatGPT4oen_US
dc.subjectLarge language models (LLMs)en_US
dc.subjectUso de tecnologíases_ES
dc.subjectChatGPT4oes_ES
dc.subjectModelos de lenguaje extensos (LLMs)es_ES
dc.subjectUso de tecnologiaspt_BR
dc.subjectChatGPT4opt_BR
dc.subjectLarge Language Modelspt_BR
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#5.02.04
dc.titleEvolución de la IA en la resolución de problemas contables: Comparación entre GPT4 y GPT4o en el Examen de Competencia Contablees_ES
dc.title.alternativeEvolution of AI in solving accounting problems: A comparison between GPT4 and GPT4o in solving the Accounting Proficiency Examen_US
dc.title.alternativeEvolução da IA em resolver problemas contábeis: uma comparação entre o GPT4 e GPT4o na resolução do Exame de Suficiênciapt_BR
dc.typeinfo:eu-repo/semantics/article
dc.type.otherArtículo

Archivos