Análise de Intenção em Conjuntos de Dados Pequenos
Comparação do Desempenho do Naive Bayes e do BERT
DOI:
https://doi.org/10.5540/03.2026.012.01.0249Keywords:
Naive Bayes, BERT, Análise de Intenção, Óleo e GásAbstract
A análise de intenção textual tem se tornado uma área de grande interesse, especialmente em setores especializados, como o de petróleo e gás, onde a precisão na interpretação de textos técnicos é fundamental. Este trabalho compara o desempenho dos modelos Naive Bayes e BERT na classificação de intenções em dados específicos desse setor. O modelo BERT (Bidirectional Encoder Representations from Transformers), por ser baseado em aprendizado profundo e pré-treinado em grandes volumes de dados, apresenta vantagens na captura de dependências contextuais complexas. Já o Naive Bayes, por sua abordagem probabilística, oferece uma solução mais leve e eficiente computacionalmente. A partir de experimentos realizados sobre um conjunto de dados do setor, analisamos métricas como acurácia, precisão e recall para avaliar a eficácia de cada abordagem. Os resultados demonstram que o modelo BERT supera o Naive Bayes em termos de desempenho, especialmente em cenários com maior ambiguidade linguística, embora o Naive Bayes ainda se apresente como uma alternativa viável para aplicações com restrições computacionais.
Downloads
References
S. Assayed, K. Shaalan e M. Alkhatib. “A chatbot intent classifier for supporting high school students”. Em: EAI Endorsed Transactions on Scalable Information Systems (2023). DOI: https://ssrn.com/abstract=4397536.
S. Chakraborty, K. Y. Ohm, H. Jeon, D. H. Kim e H. J. Jin. “Intent classification of users conversation using BERT for conversational dialogue system”. Em: 2023 25th International Conference on Advanced Communication Technology (ICACT). 2023, pp. 65–69. DOI: https://doi.org/10.23919/ICACT56868.2023.10079261.
Q. Chen, Z. Zhuo e W. Wang. “Bert for joint intent classification and slot filling”. Em: CoRR (2019), pp. 65–69. DOI: https://doi.org/10.48550/arXiv.1902.10909.
J. Devlin, M-W Chang, K Lee e K Toutanova. “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding”. Em: Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers). 2019, pp. 4171–4186. DOI: https://doi.org/10.18653/v1/N19-1423.
A. Ezen-Can. “A Comparison of LSTM and BERT for Small Corpus”. Em: arXiv preprint (2020). DOI: https://doi.org/10.48550/arXiv.2009.05451.
D. D. S. M. Gomes, F. C. Cordeiro, B. S. Consoli, N. L. Santos, V. P. Moreira, R. Vieira, S. Moraes e A. G. Evsukoff. “Portuguese word embeddings for the oil and gas industry: Development and evaluation”. Em: Computers in Industry (2021), p. 103347. DOI: https://doi.org/10.1016/j.compind.2020.103347.
M. Hasan, M. J. I. Basher e M. T. R Shawon. “Bengali intent classification with generative adversarial Bert”. Em: 2023 26th International Conference on Computer and Information Technology (ICCIT). 2023, pp. 1–6. DOI: https://doi.org/10.1109/ICCIT60459.2023.10440989.
X. Huang, T. Ma, L. Jia, Y. Zhang, H. Rong e N. Alnabhan. “An effective multimodal representation and fusion method for multimodal intent recognition”. Em: Neurocomputing (2023), p. 126373. DOI: https://doi.org/10.1016/j.neucom.2023.126373.
N. Milosevic, A. Dehghantanha e K. K. R. Choo. “Machine learning aided Android malware classification”. Em: Computers Electrical Engineering (2017), pp. 266–274. DOI: https://doi.org/10.1016/j.compeleceng.2017.02.013.
A. Palanivinayagam, C. Z. El-Bayeh e R. Damaševičius. “Twenty years of machine-learning-based text classification: A systematic review”. Em: Algorithms (2023), p. 236. DOI: https://doi.org/10.3390/a16050236.
M. Y. H. Setyawan, R. M. Awangga e S. R. Efendi. “Comparison of multinomial naive bayes algorithm and logistic regression for intent classification in chatbot”. Em: In 2018 International Conference on Applied Engineering (ICAE). 2018, pp. 1–5. DOI: 10.1109/INCAE.2018.8579372.
A. Singh e V. Jia T.and Nalagatla. “Generative AI enabled conversational Chatbot for drilling and production analytics”. Em: Abu Dhabi International Petroleum Exhibition and Conference. 2023. DOI: https://doi.org/10.2118/216267-MS.
T. Wu, M. Wang, Y. Xi e Z. Zhao. “Intent recognition model based on sequential information and sentence features”. Em: Neurocomputing (2024), p. 127054. DOI: https://doi.org/10.1016/j.neucom.2023.127054.