Выделение фактов и анализ связей

Собирая текстовую информацию со всех открытых источников и СМИ, мы должны в кратчайшие сроки определять не только ценность информации, которая содержится в тексте, но и выделять основные факты и события. С помощью нашей технологии выделения фактов мы обрабатываем все входящие записи, а затем группируем их по выделенным фактам.

Каждое предложение проходит синтаксический и морфологический разбор, благодаря которым выделяются основные факты: место, время, субъекты и объекты, глагол взаимодействия. Благодаря лингвистическому анализу из каждого предложения можно получить информацию о том, кто с кем взаимодействовал, каким именно образом, когда и где. Таким образом, мы выделяем основные факты, опуская ненужную информацию.

Мы умеем отслеживать и анализировать связи между пользователями по всем открытым источникам. Благодаря собственным технологиям мы проводим глубинный анализ данных и последующую визуализацию. Для анализа связей между пользователями используются следующие алгоритмы: Данный алгоритм позволяет выделять подгруппы людей, связанных между собой интересами, похожим поведением, публикуемым контентом, присутствием в одинаковых группах и т.д. Данный алгоритм показывает, как быстро распространяется контент между пользователями: за какой промежуток времени появляются первые лайки, репосты и комментарии, кто реагирует на контент быстрее всех и т.д. Полученные данные мы используем для дальнейшего анализа.

Помимо этого мы проводим точное выявление ботов среди подписчиков аккаунта. Мы анализируем весь информационный поток в сети Интернет, это позволяет нам с вероятностью в 90% определить искусственно созданную активность пользователя. Ранжируя профили и пользуясь набором определенных критериев, алгоритм компании SocialDataHub выделяет ботов среди общего числа пользователей, проводит вычисления по разработанным алгоритмам и предоставляет Bot-score – процент ботов от общего числа пользователей в числе подписчиков, в группах, комментариях и т.д.

Самые популярные метрики