Evolución de la IA en la resolución de problemas contables: Comparación entre GPT4 y GPT4o en el Examen de Competencia Contable

Machado de Freitas, Marcelo; Dutra Sallaberry, Jonatas; Bruno de Jesus Silva, Thiago; Silva da Rosa, Fabricia

doi:https://doi.org/10.18800/contabilidad.2025ESP.005

Evolución de la IA en la resolución de problemas contables: Comparación entre GPT4 y GPT4o en el Examen de Competencia Contable

dc.contributor.author	Machado de Freitas, Marcelo
dc.contributor.author	Dutra Sallaberry, Jonatas
dc.contributor.author	Bruno de Jesus Silva, Thiago
dc.contributor.author	Silva da Rosa, Fabricia
dc.date.accessioned	2025-11-17T20:52:55Z
dc.date.issued	2025-09-29
dc.description.abstract	The research aimed to evaluate the performance of the GPT-4o model compared to the GPT-4 model in solving questions on the Accounting Proficiency Exam. This study is grounded in the concept of natural language processing (PLN), as discussed by Brown et al. (2020). The research was conducted using the design science methodology, which aims to build and/or evaluate different technological artifacts by applying the proficiency exam questions to GPT-4o, using OpenAI's ChatGPT. While actual statistics for the Proficiency Exam show that only a portion of accountants pass, the results of artificial intelligence (AI) showed that all four editions evaluated passed with at least a 64% success rate. Overall, across the sample analyzed, the GPT-4o AI model achieved 77% accuracy compared to 71% for the GPT-4 model, achieving 84% accuracy in the last two exams using the most recent model. However, on some questions that the GPT-4 model had previously answered correctly, the more recent model ended up answering incorrectly or differently than expected by the question developers. These results contribute to the literature studying the use of AI in accounting, particularly the application of natural language processing models and large language models (LLMs).	en_US
dc.description.abstract	La investigación tuvo como objetivo evaluar el rendimiento del modelo GPT-4o en comparación con el modelo GPT-4 en la resolución de preguntas del Examen de Competencia Contable. Este estudio se fundamenta en el concepto de procesamiento del lenguaje natural (PLN) de Brown et al. (2020). La investigación se realizó utilizando la metodología design science, que busca construir y/o evaluar diferentes artefactos tecnológicos aplicando las preguntas del Examen de Competencia al GPT-4o, utilizando ChatGPT de OpenAI. Si bien las estadísticas reales del Examen de Competencia muestran que solo una parte de los contadores lo aprueba, los resultados de la inteligencia artificial (IA) mostraron que las cuatro ediciones evaluadas aprobaron con al menos 64% de éxito. En general, en la muestra analizada, el modelo de IA GPT-4o alcanzó 77% de precisión, en comparación con el 71% del modelo GPT-4; así, se alcanzó un 84% de precisión en los dos últimos exámenes con el modelo más reciente. Sin embargo, en algunas preguntas que el modelo GPT-4 había respondido correctamente previamente, el modelo más reciente terminó respondiendo incorrectamente o de forma diferente a la esperada por los desarrolladores. Estos resultados contribuyen a la literatura que estudia el uso de la IA en contabilidad, en particular, en la aplicación de modelos de procesamiento del lenguaje natural y modelos de lenguaje extenso (LLMs).	es_ES
dc.description.abstract	A pesquisa teve por objetivo avaliar o desempenho do modelo GPT-4o em relação ao modelo GPT-4 na resolução de questões do Exame de Suficiência em Contabilidade. Esse estudo se caseia no conceito de processamento de linguagem natural (PLN) de Brown et al. (2020). A pesquisa foi operacionalizada com a metodologia de design science, que visa construir e/ou avaliar diferentes artefatos tecnológicos, mediante a aplicação das questões do Exame de Suficiência no GPT-4o, por meio do ChatGPT da OpenAI. Enquanto as estatísticas reais do Exame de Suficiência demonstram a aprovação de apenas uma parcela dos contabilistas, os resultados da inteligência artificial (IA) foram de aprovação em todas as quatro edições avaliadas com pelo menos 64% de aproveitamento. No âmbito geral da amostra analisada, o modelo de IA do GPT-4o apresentou 77% de aproveitamento de respostas frente a 71% do modelo GPT-4, alcançando uma acurácia de 84% nos últimos dois exames pelo modelo mais recente. Ainda assim, em algumas questões que o modelo GPT-4 havia acertado, esse modelo mais atual acabou respondendo de forma equivocada, ou diferente do previsto pelos elaboradores das questões. Esses resultados contribuem para a literatura que estuda o uso de IA dentro do campo da contabilidade, em especial a aplicação de modelos de linguagem de processamento natural e large language models (LLMs).	pt_BR
dc.format	application/pdf
dc.identifier.doi	https://doi.org/10.18800/contabilidad.2025ESP.005
dc.identifier.uri	https://revistas.pucp.edu.pe/index.php/contabilidadyNegocios/article/view/31895/28006
dc.identifier.uri	http://hdl.handle.net/20.500.14657/205111
dc.language.iso	por
dc.publisher	Pontificia Universidad Católica del Perú	es_ES
dc.publisher.country	PE
dc.relation.ispartof	urn:issn:2221-724X
dc.relation.ispartof	urn:issn:1992-1896
dc.rights	info:eu-repo/semantics/openAccess	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by/4.0
dc.source	Contabilidad y Negocios; Vol. 20. Edición especial 2025.	es_ES
dc.subject	Use of technologies	en_US
dc.subject	ChatGPT4o	en_US
dc.subject	Large language models (LLMs)	en_US
dc.subject	Uso de tecnologías	es_ES
dc.subject	ChatGPT4o	es_ES
dc.subject	Modelos de lenguaje extensos (LLMs)	es_ES
dc.subject	Uso de tecnologias	pt_BR
dc.subject	ChatGPT4o	pt_BR
dc.subject	Large Language Models	pt_BR
dc.subject.ocde	https://purl.org/pe-repo/ocde/ford#5.02.04
dc.title	Evolución de la IA en la resolución de problemas contables: Comparación entre GPT4 y GPT4o en el Examen de Competencia Contable	es_ES
dc.title.alternative	Evolution of AI in solving accounting problems: A comparison between GPT4 and GPT4o in solving the Accounting Proficiency Exam	en_US
dc.title.alternative	Evolução da IA em resolver problemas contábeis: uma comparação entre o GPT4 e GPT4o na resolução do Exame de Suficiência	pt_BR
dc.type	info:eu-repo/semantics/article
dc.type.other	Artículo

Collections

Contabilidad y Negocios; Vol. 20. Edición especial 2025.

Evolución de la IA en la resolución de problemas contables: Comparación entre GPT4 y GPT4o en el Examen de Competencia Contable

Files

Collections