Метод автоматизованого визначення наявності образливого вмісту текстових повідомлень у соціальних мережах
DOI:
https://doi.org/10.26642/tn-2018-1(81)-103-108Ключові слова:
образливий вміст, оброблення текстових даних, соціальні мережі, машинне навчання, передоброблення природномовних текстових данихАнотація
Проведено аналіз специфіки спілкування Інтернет-користувачів. Особливу увагу приділено спілкуванню в соціальних мережах та, зокрема, проблемі виявлення образливого вмісту в повідомленнях користувачів. Визначено основні характерних рис спілкування в соціальних мережах, а також проведено аналіз чинників, що можуть погіршувати точність автоматизованої детекції образливого вмісту. Проаналізовано етапи обробки природномовних текстових даних, зокрема, визначення образливого контенту, на предмет можливості їх модифікації для врахування особливостей спілкування в соціальних мережах та інших факторів, що можуть вплинути на кінцевий результат класифікації текстових даних. Визначено, що характерні риси повідомлень та особливості спілкування в соціальних мережах, такі як наявність символів та цифр, що можуть призвести до заплутування сприйняття повідомлення, наявність емодзі, контекст (на рівні зв’язків користувачів у соцмережах) та контекст (на рівні повідомлень у соціальних мережах), можуть бути враховані під час автоматизованого виявлення образливого вмісту в текстових повідомленнях у соціальних мережах. Визначено відповідні модифікації етапів передоброблення тексту та аналізу результатів класифікації. Запропоновано метод автоматизованого визначення образливого вмісту текстових повідомлень у соціальних мережах, що базується на засадах машинного навчання з модифікованим підходом до передоброблення природномовних текстових даних. Запропоновано формат вхідних даних для ефективного визначення в них образливого вмісту.Посилання
Novata, Ch., Tetro, Dzh., Tomas, A., Mehdad, Ju. and Chang, Ju. (2016), «Vyznachennja zlovzhyvan' movamy v Internet-kontent korystuvacha», 25 Mizhnarodna konferencija na veb-storinkah, Monreal', Kvebek (Kanada), pp. 145–153.
Zabolotnja, T.M. and Bartkov’jak, A.Ju. (2016), «Programna biblioteka metodiv analizu tonal'nosti vidgukiv Internet-korystuvachiv», Informatics and Computer Technics Problems, tezy dopovidej, vid 21–24 travnja, Chernivci, pp. 85–87.
Lu, X., Ai, W., Lju, X., Li, Q., Vang, N., Huan, G. and Mei, Q. (2016), «Vchymosja z povsjudnoi' movy: empirychnyj analiz vykorystannja smajlykiv korystuvachem smajliv», Procedury Mizhnarodnoi' spil'noi' konferencii' ACM z povsjudnogo ta povsjakdennogo obchyslennja, pp. 770–780.
Tauch, K. and Kanjo, E. (2016), «Roli «em» u povidomlenni mobil'nyh telefoniv», Mizhnarodna spil'na konferencija z povsjudnogo ta povsjakdennogo obchyslennja, UbiComp Adjunct, pp. 1560–1565.
Miller, H., Thebault-Spieker, J., Chang, S., Johnson, I.L., Terveen, L.G. and Hecht, B. (2016), «Shhaslyvo shhaslyvi» abo «gotovi do borot'by»: rizne tlumachennja smajlykiv», 10 Mizhnarodna konferencija Web i social'nyh media, ICWSM-2016, pp. 259–268.
Zabolotnja, T.M. and Sokolovs'ka, A.V. (2018), «Pidhid do vyznachennja obrazlyvogo vmistu tekstovyh povidomlen' v social'nyh merezhah», Prykladna matematyka ta komp’jutyng. PMK-2018, tezy dopovidej, vid 21–23 bereznja, Kyi'v, pp. 243–249.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2020 Тетяна Миколаївна Заболотня, Анна Віталіївна Соколовська
Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial 4.0 International License.
Автор, який подає матеріали до друку, зберігає за собою всі авторські права та надає відповідному виданню право першої публікації, дозволяючи розповсюджувати даний матеріал із зазначенням авторства та джерела первинної публікації, а також погоджується на розміщення її електронної версії на сайті Національної бібліотеки ім. В.І. Вернадського та у відкритому доступі в електронному архіві університету та на сайті журналу.