Метод автоматизованого визначення наявності образливого вмісту текстових повідомлень у соціальних мережах

Тетяна Миколаївна Заболотня, Анна Віталіївна Соколовська

Анотація


Проведено аналіз специфіки спілкування Інтернет-користувачів. Особливу увагу приділено спілкуванню в соціальних мережах та, зокрема, проблемі виявлення образливого вмісту в повідомленнях користувачів. Визначено основні характерних рис спілкування в соціальних мережах, а також проведено аналіз чинників, що можуть погіршувати точність автоматизованої детекції образливого вмісту. Проаналізовано етапи обробки природномовних текстових даних, зокрема, визначення образливого контенту, на предмет можливості їх модифікації для врахування особливостей спілкування в соціальних мережах та інших факторів, що можуть вплинути на кінцевий результат класифікації текстових даних. Визначено, що характерні риси повідомлень та особливості спілкування в соціальних мережах, такі як наявність символів та цифр, що можуть призвести до заплутування сприйняття повідомлення, наявність емодзі, контекст (на рівні зв’язків користувачів у соцмережах) та контекст (на рівні повідомлень у соціальних мережах), можуть бути враховані під час автоматизованого виявлення образливого вмісту в текстових повідомленнях у соціальних мережах. Визначено відповідні модифікації етапів передоброблення тексту та аналізу результатів класифікації. Запропоновано метод автоматизованого визначення образливого вмісту текстових повідомлень у соціальних мережах, що базується на засадах машинного навчання з модифікованим підходом до передоброблення природномовних текстових даних. Запропоновано формат вхідних даних для ефективного визначення в них образливого вмісту.

Ключові слова


образливий вміст; оброблення текстових даних; соціальні мережі; машинне навчання; передоброблення природномовних текстових даних

Повний текст:

PDF

Посилання


«Internet World Stats» [On-line], available at: https://www.internetworldstats.com/stats

«Cyber Bullying Law and Legal Definition» [On-line], available at: https://definitions.uslegal.com/c/cyber-bullying/

Novata, Ch., Tetro, Dzh., Tomas, A., Mehdad, Ju. and Chang, Ju. (2016), «Vyznachennja zlovzhyvan' movamy v Internet-kontent korystuvacha», 25 Mizhnarodna konferencija na veb-storinkah, Monreal', Kvebek (Kanada), pp. 145–153.

«Vikipedija – vil'na encyklopedija» [On-line], available at: https://uk.wikipedia.org/wiki/Social'na_merezha

«Navchal'ni materialy on-lajn» [On-line], available at: http://pidruchniki.com/18421120/ritorika/pobutove_spilkuvannya

Zabolotnja, T.M. and Bartkov’jak, A.Ju. (2016), «Programna biblioteka metodiv analizu tonal'nosti vidgukiv Internet-korystuvachiv», Informatics and Computer Technics Problems, tezy dopovidej, vid 21–24 travnja, Chernivci, pp. 85–87.

Lu, X., Ai, W., Lju, X., Li, Q., Vang, N., Huan, G. and Mei, Q. (2016), «Vchymosja z povsjudnoi' movy: empirychnyj analiz vykorystannja smajlykiv korystuvachem smajliv», Procedury Mizhnarodnoi' spil'noi' konferencii' ACM z povsjudnogo ta povsjakdennogo obchyslennja, pp. 770–780.

Tauch, K. and Kanjo, E. (2016), «Roli «em» u povidomlenni mobil'nyh telefoniv», Mizhnarodna spil'na konferencija z povsjudnogo ta povsjakdennogo obchyslennja, UbiComp Adjunct, pp. 1560–1565.

Miller, H., Thebault-Spieker, J., Chang, S., Johnson, I.L., Terveen, L.G. and Hecht, B. (2016), «Shhaslyvo shhaslyvi» abo «gotovi do borot'by»: rizne tlumachennja smajlykiv», 10 Mizhnarodna konferencija Web i social'nyh media, ICWSM-2016, pp. 259–268.

Zabolotnja, T.M. and Sokolovs'ka, A.V. (2018), «Pidhid do vyznachennja obrazlyvogo vmistu tekstovyh povidomlen' v social'nyh merezhah», Prykladna matematyka ta komp’jutyng. PMK-2018, tezy dopovidej, vid 21–23 bereznja, Kyi'v, pp. 243–249.


Пристатейна бібліографія ГОСТ


  1. Internet World Stats [Електронний ресурс]. – Режим доступу : https://www.internetworldstats.com/stats.
  2. Cyber Bullying Law and Legal Definition [Електронний ресурс]. – Режим доступу : https://definitions.uslegal.com/c/cyber-bullying/.
  3. Визначення зловживань мовами в Інтернет-контент користувача / Ч.Новата, Дж.Тетро, А.Томас, Ю.Мехдад, Ю.Чанг // 25 Міжнародна конференція на веб-сторінках. – Монреаль, Квебек (Канада). – 2016. – С. 145–153.
  4. Вікіпедія – вільна енциклопедія [Електронний ресурс]. – Режим доступу : https://uk.wikipedia.org/wiki/Соціальна_мережа.
  5. Навчальні матеріали онлайн [Електронний ресурс]. – Режим доступу : http://pidruchniki.com/18421120/ritorika/pobutove_spilkuvannya.
  6. Заболотня Т.М. Програмна бібліотека методів аналізу тональності відгуків Інтернет-користувачів / Т.М. Заболотня, А.Ю. Бартков’як // Informatics and Computer Technics Problems : Тези доповідей. – Чернівці. – 21–24 травня, 2016. – С. 85–87.
  7. Вчимося з повсюдної мови: емпіричний аналіз використання смайликів користувачем смайлів / X.Лу, W.Ai, X.Лю, Q.Лі, Н.Ванг, Г.Хуан, Q.Mei // Процедури Міжнародної спільної конференції ACM з повсюдного та повсякденного обчислення. – 2016. – С. 770–780.
  8. Тауч К. Ролі «ем» у повідомленні мобільних телефонів / C.Tauch, E.Kanjo // Міжнародна спільна конференція з повсюдного та повсякденного обчислення. – UbiComp Adjunct. – 2016. – С. 1560–1565.
  9. «Щасливо щасливі» або «готові до боротьби»: різне тлумачення смайликів / H.Miller, J.Thebault- Spieker, S.Chang, I.L. Johnson, L.G. Terveen, B.Hecht // 10 Міжнародна конференція Web і соціальних медіа. – ICWSM 2016. – 2016. – С. 259–268.
  10. Заболотня Т.М. Підхід до визначення образливого вмісту текстових повідомлень в соціальних мережах / Т.М. Заболотня, А.В. Соколовська // Прикладна математика та комп’ютинг. ПМК 2018 : тези доповідей. – Київ. – 21-23 березня, 2018. – С. 243–249.




DOI: https://doi.org/10.26642/tn-2018-1 (81)-103-108

Copyright (c) 2018 Тетяна Миколаївна Заболотня, Анна Віталіївна Соколовська

Ліцензія Creative Commons
Це видання ліцензовано за ліцензією Creative Commons Із Зазначенням Авторства - Некомерційна 4.0 Міжнародна.