Метод автоматизованого визначення наявності образливого вмісту текстових повідомлень у соціальних мережах

Автор(и)

  • Тетяна Миколаївна Заболотня Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна
  • Анна Віталіївна Соколовська Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна

DOI:

https://doi.org/10.26642/tn-2018-1(81)-103-108

Ключові слова:

образливий вміст, оброблення текстових даних, соціальні мережі, машинне навчання, передоброблення природномовних текстових даних

Анотація

Проведено аналіз специфіки спілкування Інтернет-користувачів. Особливу увагу приділено спілкуванню в соціальних мережах та, зокрема, проблемі виявлення образливого вмісту в повідомленнях користувачів. Визначено основні характерних рис спілкування в соціальних мережах, а також проведено аналіз чинників, що можуть погіршувати точність автоматизованої детекції образливого вмісту. Проаналізовано етапи обробки природномовних текстових даних, зокрема, визначення образливого контенту, на предмет можливості їх модифікації для врахування особливостей спілкування в соціальних мережах та інших факторів, що можуть вплинути на кінцевий результат класифікації текстових даних. Визначено, що характерні риси повідомлень та особливості спілкування в соціальних мережах, такі як наявність символів та цифр, що можуть призвести до заплутування сприйняття повідомлення, наявність емодзі, контекст (на рівні зв’язків користувачів у соцмережах) та контекст (на рівні повідомлень у соціальних мережах), можуть бути враховані під час автоматизованого виявлення образливого вмісту в текстових повідомленнях у соціальних мережах. Визначено відповідні модифікації етапів передоброблення тексту та аналізу результатів класифікації. Запропоновано метод автоматизованого визначення образливого вмісту текстових повідомлень у соціальних мережах, що базується на засадах машинного навчання з модифікованим підходом до передоброблення природномовних текстових даних. Запропоновано формат вхідних даних для ефективного визначення в них образливого вмісту.

Біографії авторів

Тетяна Миколаївна Заболотня, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

T.M. Zabolotnia

Анна Віталіївна Соколовська, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

A.V. Sokolovska

Посилання

Novata, Ch., Tetro, Dzh., Tomas, A., Mehdad, Ju. and Chang, Ju. (2016), «Vyznachennja zlovzhyvan' movamy v Internet-kontent korystuvacha», 25 Mizhnarodna konferencija na veb-storinkah, Monreal', Kvebek (Kanada), pp. 145–153.

Zabolotnja, T.M. and Bartkov’jak, A.Ju. (2016), «Programna biblioteka metodiv analizu tonal'nosti vidgukiv Internet-korystuvachiv», Informatics and Computer Technics Problems, tezy dopovidej, vid 21–24 travnja, Chernivci, pp. 85–87.

Lu, X., Ai, W., Lju, X., Li, Q., Vang, N., Huan, G. and Mei, Q. (2016), «Vchymosja z povsjudnoi' movy: empirychnyj analiz vykorystannja smajlykiv korystuvachem smajliv», Procedury Mizhnarodnoi' spil'noi' konferencii' ACM z povsjudnogo ta povsjakdennogo obchyslennja, pp. 770–780.

Tauch, K. and Kanjo, E. (2016), «Roli «em» u povidomlenni mobil'nyh telefoniv», Mizhnarodna spil'na konferencija z povsjudnogo ta povsjakdennogo obchyslennja, UbiComp Adjunct, pp. 1560–1565.

Miller, H., Thebault-Spieker, J., Chang, S., Johnson, I.L., Terveen, L.G. and Hecht, B. (2016), «Shhaslyvo shhaslyvi» abo «gotovi do borot'by»: rizne tlumachennja smajlykiv», 10 Mizhnarodna konferencija Web i social'nyh media, ICWSM-2016, pp. 259–268.

Zabolotnja, T.M. and Sokolovs'ka, A.V. (2018), «Pidhid do vyznachennja obrazlyvogo vmistu tekstovyh povidomlen' v social'nyh merezhah», Prykladna matematyka ta komp’jutyng. PMK-2018, tezy dopovidej, vid 21–23 bereznja, Kyi'v, pp. 243–249.

##submission.downloads##

Опубліковано

2018-06-21

Як цитувати

Заболотня, Т. М., & Соколовська, А. В. (2018). Метод автоматизованого визначення наявності образливого вмісту текстових повідомлень у соціальних мережах. Вісник ЖДТУ. Серія "Технічні науки", (1 (81), 103–108. https://doi.org/10.26642/tn-2018-1(81)-103-108

Номер

Розділ

ІНЖЕНЕРІЯ ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ.КОМП’ЮТЕРНА ІНЖЕНЕРІЯ