Skip to content

Программное средство анализа частоты встречаемости слов в текстах на русском языке.

eugchud/keywords

Repository files navigation

Keywords

Данное программное решение предназначено для анализа частоты встречаемости слов в текстах на русском языке. Решение поддерживает объединение различных форм одного слова при помощи лемматизации (т. е. приведения к единой грамматической основе), а также обладает функциональностью черного списка для исключения слов из результатов анализа. Предлагаемый по умолчанию черный список осуществляет исключение предлогов, местоимений и других служебных слов. Пользователю также предлагается возможность редактирования черного списка.

В программном решении используются элементы Solarix SDK, в частности, база данных слов (словарь) и некоторые алгоритмы обработки текста.

Скомпилированная версия программного решения доступна по ссылке: https://drive.google.com/open?id=1ZFj4SaCDRgda-CLDX9wnCZ4l6mOFKB2j

Изменения по сравнению с v 1.0:

  • введена концепция рабочих пространств; возможность их сохранения и загрузки;
  • введена возможность редактирования черного списка для каждого уникального рабочего пространства;
  • черный список и другие настройки выведены на главную форму;
  • исправлен баг некорректного сохранения *.csv-файла;
  • исправлены некоторые другие баги.

About

Программное средство анализа частоты встречаемости слов в текстах на русском языке.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages