СИСТЕМА ПОРІВНЯЛЬНОГО АНАЛІЗУ ТЕКСТОВИХ ДОКУМЕНТІВ

Анастасія Ігорівна Вавіленкова

Анотація


У матеріалах статті проаналізовано роботу існуючих інтелектуальних систем порівняльного аналізу електронних текстових документів, наведено порівняльну характеристику їх основних функціональних можливостей. Запропоновано інтелектуальну систему порівняльного аналізу текстових документів, що використовує нову методику пошуку текстових збігів, в основі якої лежить побудова логіко-лінгвістичних моделей текстової інформації. Розроблена система складається з п’яти блоків функціонування. Перший блок відповідає за подачу текстів на вхід системи. Другий – за ідентифікацію складових логіко-лінгвістичних моделей текстів, що передбачає створення множини логіко-лінгвістичних моделей усіх речень природної мови, що утворюють кожен текст. У третьому блоці для кожного з двох текстів будується його логіко- лінгвістична модель, що складається з лінгвістичної та семантико-синтаксичної складових. Далі відбувається об’єднання та заміна структурних компонентів логіко-лінгвістичних моделей, отриманих на попередньому блоці функціонування системи. П’ятий блок присвячено порівнянню логіко-лінгвістичних моделей текстових документів, внаслідок якого знаходиться відсоток збігу за стилістикою, за структурою складних синтаксичних частин, схожістю ключових слів та словосполучень, тематикою та унікальністю.

Ключові слова


природна мова; логіко-лінгвістична модель; текстова інформація; обробка тексту; система порівняльного аналізу; інтелектуальна система

Повний текст:

PDF

Пристатейна бібліографія ГОСТ


1. Advego Plagiatus – проверка уникальности текста, 2008–2016 [Електронний ресурс]. – Режим доступу : http://advego.ru/plagiatus/top/.

2. Он-лайн сервис проверки текста на уникальность, 2016 [Електронний ресурс]. – Режим доступу : www.text.ru.

3. Антиплагіатна Інтернет-система, 2015 [Електронний ресурс]. – Режим доступу : http://strikeplagiarism.com/ua/antiplagiarism-system/

4. Апресян Ю.Д. Лексическая семантика : в 2-х т. Т. 1 / Ю.Д. Апресян. – М. : Восточная литература, 1995. – 422 с.

5. Методы и модели анализа данных: OLAP и Data Mining / А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. – СПб. : БХВ-Петербрг, 2007. – 384 с.

6. Вавіленкова А.І. Порівняльний аналіз речень природної мови за змістом / А.І. Вавіленкова // Математичні машини та системи. – 2015. – № 2. – С. 97–103.

7. Вавиленкова А.И. Основные принципы синтеза логико-лингвистических моделей / А.И. Вавиленкова // Кибернетика и системный анализ. – 2015. – Т. 51, № 5. – С. 176–185.

8. Лайонз Дж. Лингвистическая семантика : монография / Дж.Лайонз. – М. : Языки славянской культуры, 2003. – 400 с.

9. Ландэ Д.В. Поиск знаний в Internet. Профессиональная работа / Д.В. Ландэ. – М. : Диалектика, 2005. – 272 с.

10. Никитин М.В. Курс лингвистической семантики : учеб. пособие / М.В. Никитин. – 2-е изд. – СПб. : Изд-во РГПУ им. А.И. Герцена, 2007. – 819 с.

11. Лінгвістичні та технологічні основи тлумачної лексикографії / В.А. Широков, В.М. Білоноженко, О.В. Бугаков та ін. – К. : Довіра, 2010. – 295 с.

DOI: https://doi.org/10.26642/tn-2015-4(75)-94-100

Copyright (c) 2016 Анастасія Ігорівна Вавіленкова

Ліцензія Creative Commons
Це видання ліцензовано за ліцензією Creative Commons Із Зазначенням Авторства - Некомерційна 4.0 Міжнародна.