ДОСЛІДЖЕННЯ МОЖЛИВОСТЕЙ PROMPTING ПІДХОДУ З ВИКОРИСТАННЯМ GPT 3.5-TURBO ДЛЯ ТЕКСТОВОЇ КАТЕГОРИЗАЦІЇ
Опубліковано 04.11.2023
Як цитувати
Завантаження
Авторське право (c) 2023 Юрій Волощук ; Олександр Міца (Науковий керівник)

Ця робота ліцензується відповідно до Creative Commons Attribution-ShareAlike 4.0 International License.
Анотація
Моделі машинного навчання революціонізували галузь текстової категоризації, автоматизуючи процес призначення попередньо визначених категорій або міток текстових даних [1]. Традиційні алгоритми машинного навчання, такі як наївний байес, методи опорних векторів (SVM) [2] та випадковий ліс широко використовуються для завдань текстової класифікації. Ці алгоритми ґрунтуються на інженерії ознак, де відповідна інформація витягається з тексту, часто за допомогою методів, таких як TF-IDF (Частота слів - Інверсна частота документа) або представлення "мішок слів". Хоча ці методи довели свою ефективність, вони вимагають експертизи в галузі та ручного вибору ознак, що обмежує їх адаптивність до різних текстових даних [3].
Посилання
- Lupei, M., Mitsa, O., Sharkan, V., Vargha, S., & Gorbachuk, V. (2022, April). The identification of mass media by text based on the analysis of vocabulary peculiarities using support vector machines. In 2022 International Conference on Smart Information Systems and Technologies (SIST) (pp. 1-6). IEEE. doi: 10.1109/SIST54437.2022.9945774.
- Lupei, M., Mitsa, O., Sharkan, V., Vargha, S., Lupei, N. (2023). Analyzing Ukrainian Media Texts by Means of Support Vector Machines: Aspects of Language and Copyright. In: Hu, Z., Dychka, I., He, M. (eds) Advances in Computer Science for Engineering and Education VI. ICCSEEA 2023. Lecture Notes on Data Engineering and Communications Technologies, vol 181. Springer, Cham. doi: 10.1007/978-3-031-36118-0_16.
- Lupei, M., Mitsa, A., Povkhan, I., & Sharkan, V. (2020, August). Determining the eligibility of candidates for a vacancy using artificial neural networks. In 2020 IEEE Third International Conference on Data Stream Mining & Processing (DSMP) (pp. 18-22). IEEE. doi: 10.1109/DSMP47368.2020.9204020.
- Mitsa, O., Sharkan, V., Maksymchuk, V., Varha, S., & Shkurko, H. (2023). Ethnocultural, Educational and Scientific Potential of the Interactive Dialects Map. In 2023 IEEE International Conference on Smart Information Systems and Technologies (SIST) (pp. 226-231). Astana, Kazakhstan. doi: 10.1109/SIST58284.2023.10223544.
- Lupei, M., Shlahta, M., Mitsa, O., Horoshko, Y., Tsybko, H., & Gorbachuk, V. (2022, September). Development of an Interactive Map Within the Implementation of Actual State and Public Directions. In 2022 12th International Conference on Advanced Computer Information Technologies (ACIT) (pp. 384-387). IEEE. doi: 10.1109/ACIT54803.2022.9913191.
- Popovych, N., Lutskiv, A., Mitsa, O., Lyntvar, O., & Ivanova, A. (2023). Ukrainian Redaction of Church Slavonic (URCS): Needs for Digitalization and Text Corpora Platform Generation. Part I.
