Дистрибутивно-статистический анализ языка русской прозы 1850–1870-х гг. Т. 3
Шайкевич А. Я. | Андрющенко В. М. | Ребецкая Н. А.
Studia Philologica
2021
768 страниц

Том 3 монографии посвящен анализу среднего интервала текста. Исследуемый корпус прозы автоматически членится на фрагменты по 40 слов. Если совместная встречаемость двух слов во фрагментах существенно превышает величину, подсчитанную на основе нулевой гипотезы, делается вывод о наличии связи между этими словами. В результате возникает огромная сеть текстуальных связей слов. Показан способ выявления кластеров в этой сети.

Полностью сеть текстуальных связей слов (26 тысяч слов и 500 тысяч связей) представлена на компакт диске.