Ученые ТГУ составили индекс благополучия россиян по анализу соцсетей
ТОМСК, 21 фев – РИА Томск. Ученые Томского государственного университета (ТГУ) рассчитали индексы благополучия для каждого региона России, проанализировав данные социальных сетей; самые отрицательные оценки качества жизни зафиксированы в Западной Сибири, а наиболее положительные – в Чукотском автономном округе. Подробности – в обзоре РИА Томск. Уточняется, что исследования проводят ученые лаборатории наук о больших данных и проблемах общества ТГУ при поддержке гранта Российского фонда фундаментальных исследований (РФФИ). Лаборатория была создана в 2016 году, ее научным руководителем сейчас является профессор Орегонского университета (США) Михаил Мягков. Коллектив лаборатории – 20 человек – анализирует открытые данные на основе цифрового следа пользователей (посты, комментарии, дружественные связи и другое), в том числе из социальных сетей. Классификация благополучия Автор проекта "Изучение качества жизни россиян по данным соцсетей" – научный сотрудник лаборатории Евгений Щекотин. Он и его коллеги планируют посмотреть в динамике, как у людей меняется оценка той или иной сферы жизни. Для этого еще в прошлом году ученые начали разрабатывать методологию анализа благополучия россиян: идея была в том, чтобы изучать региональные сообщества, но не все подряд, а с исключением "мусорных" – "отдам даром", "доставка пиццы/суши" так далее. "Был разработан классификатор сообщений по 19 категориям социальной, экономической и политической сферы. Сейчас в лаборатории есть данные за 2018 год, идет выгрузка данных за 2019-й. О динамике пока говорить рано, однако рассчитаны индексы благополучия по каждому региону страны, плюс есть такие индексы по каждой категории", – говорится в сообщении. Кому на Руси жить хорошо "Итоговое положительное значение у нас получилось по всем категориям только по Чукотскому автономному округу. Самые высокие отрицательные оценки качества жизни прослеживались, в основном, в регионах Западной Сибири. Наименьшие отрицательные значения зафиксированы в Камчатском крае, Магаданской области, Приморском крае, в Москве", – цитируется в сообщении сотрудница лаборатории Галина Коварж. По ее словам, наибольшую обеспокоенность у пользователей вызывает такой показатель, как безопасность, он намного выше в сравнении с другими. "По всем категориям и по трем тональностям – позитивной, негативной и нейтральной – обработано более 3,3 миллиона постов за 2018 год. Алгоритм также отбрасывает "мусорные" сообщения, по заданной формуле рассчитывает индекс благополучия, и на основе полученных данных команда проекта выводит среднемесячные значения по каждой категории и тональности в каждом регионе страны", – дополняет пресс-служба. Так выясняется, насколько люди удовлетворены или нет, например, инфраструктурой, внутренней политикой в регионе, экологической ситуацией и так далее. В классификаторе также уделяется внимание отношениям между людьми, общему эмоциональному состоянию человека. Ученые не упускают эти важные личностные аспекты, чтобы не было формального подхода к исследованию. Исследование для миллионов Ученые подчеркивают, что в настоящее время существуют две теории измерения благополучия людей – объективная и субъективная. Первая подразумевает стандартное использование статистических данных, вторая – использование данных соцопросов, анкетирования и личностных оценок, полученных, например, в процессе социальных экспериментов. "В масштабах страны, где численность населения составляет почти 147 миллионов человек, стандартный соцопрос охватывает в среднем 1,6 тысячи человек. А с помощью соцсетей мы можем получить гораздо больший охват", – говорит Коварж. По ее словам, по автоматическому алгоритму поиска ученые будут анализировать в каждом регионе по 400–500 сообществ в соцсетях. Таким образом, они смогут охватить около 80 миллионов зарегистрированных пользователей соцсетей, из которых более 60 миллионов – жители России. Как уточняется в сообщении, в этом году начнется автоматический отсев ботов, которые встречаются в самых разных сообществах – в том числе и в тех, которые интересны для анализа индекса благополучия реальных людей