Dmitriy A. Chernichkin1 & Anastasiya I. Krivenko2
Astrakhan Tatishchev State University. Astrakhan, Russia
Received: 15 February 2023 | Revised: 12 May 2023 | Accepted: 23 May 2023
Abstract
The article is devoted to the studying of the opinions and sentiments of users of regional communities in the social network VKontakte using methods of machine analysis of text data, supplemented by sociological research methods. In the course of the study, we identified a list of current topics discussed by the inhabitants of the region, determined the most frequently mentioned persons, and analyzed the tone of their mention. Additionally, on the basis of the obtained results, the index of subjective (non-) well-being (ISW) was calculated for each district of the region and a map of the emotional coloring of posts from the communities of the analyzed social network was built. The results of the study can be used to monitor the situation in the region, finding problem areas, elicitation opinion leaders (popular personalities of the region that have a special influence on the opinion of the population), as well as identify the most interesting topics and urgent problems for the population. In perspective, this method of monitoring the social sentiments of the population of the region can be improved by automating the addition of new data to the analytical project. In the future, the addition of mathematical models to the system will make it possible to create graphs for predicting further changes in the region.
Keywords
Social Sentiments; Media; Vkontakte; Text Mining; Isnw-B; Region; Astrakhan Region; Big Data; Content Analysis; Polyanalyst; Data Visualization
__________
Черничкин Дмитрий Алексеевич1, Кривенко Анастасия Ивановна2
Астраханский государственный университет им. В.Н. Татищева. Астрахань, Россия
Рукопись получена: 15 февраля 2023 | Пересмотрена: 12 мая 2023 | Принята: 23 мая 2023
Аннотация
Статья посвящена изучению мнений и настроений пользователей региональных сообществ в социальной сети ВКонтакте с использованием методов машинного анализа текстовых данных, дополненные социологическими методами исследования. В процессе исследования нами был выделен перечень актуальных тем, обсуждаемый жителями региона, определены наиболее часто упоминаемые персоны, а также проанализирована тональность их упоминания. Дополнительно на основе полученных результатов был рассчитан индекс субъективного (не)благополучия (ИСНБ) для каждого района области и построена карта эмоциональной окраски постов из сообществ анализируемой социальной сети. Полученные результаты исследования можно использовать для мониторинга ситуации в регионе, определения проблемных районов, выявления лидеров мнений (популярных личностей региона, оказывающих особое влияние на мнение населения), а также выявления наиболее интересующих население тем и актуальных проблем. В перспективе данный метод мониторинга социальных настроений населения региона может быть усовершенствован автоматизацией добавления новых данных в аналитический проект. В будущем, дополнение системы математическими моделями позволит создавать графики прогнозирования дальнейших изменений в регионе.
Ключевые слова
социальные настроения; медиа; Вконтакте; Text Mining; ИСНБ; регион; Астраханская область; большие данные; контент-анализ; PolyAnalyst; визуализация данных
__________
Развитие интернет-пространства способствует экспоненциальному росту информации в социальных сетях. Анализ настроений и мнений в контенте новостных каналов, сообществ и комментариях к ним со стороны населения позволяет создать систему поддержки принятия решений для мониторинга ситуации в регионах (Марьенков & Кривенко, 2022), в стране в целом (Smetanin, 2020), а также в соседних странах и странах, оказывающих влияние на объект, в том числе и в Прикаспийском регионе.
Социальные сети становятся все более важной частью нашей личной и профессиональной жизни. Они используются для различных целей, основными мотивами которых являются поддержание и создание связей с другими пользователями, обмен и получение информации, проявление политической активности, обсуждение социальных проблем регионов и т.д. (Dickinger & et al., 2008; Durahim & Coşku, 2015; Беленкова & Белоконев, 2020; Зимова и др., 2020). В рамках информационных систем (ИС) было проведено немало исследований по использованию социальных сетей в целом (Ahmed & et al., 2014; Абдулаева, 2015), с акцентом на такие аспекты, как обмен знаниями (Beck & et al., 2014), приобретение знаний (Leonardi, 2015) или стимулирование политической активности (Есиев, 2021). В этом смысле огромные возможности социальных медиа с каждым годом все больше повышают интерес к проблеме сентимент-анализа (или анализ тональности текста) – автоматического выделения в текстах сообщений пользователей эмоционально окрашенной лексики, например, эмоциональных оценок авторов сообщений по отношению к обсуждаемым темам, объектам, событиям и т.п. Огромные объемы уже накопленных данных и скорость поступления новых не оставляют шансов заинтересованным лицам и компаниям на проведение анализа данных в ручном режиме, что делает разработку инструментов автоматического извлечения требуемой информации актуальной задачей.
В фокусе нашего внимания находится Астраханская область как стратегически важный регион на территории Прикаспия, а социальные настроения и благополучие жителей данной территории являются одним из важнейших факторов сохранения стабильности данной территории. Также все муниципальные образования Астраханской области являются достаточно активными в различных социальных сетях (как со стороны органов власти, так и жителей районов), что, в свою очередь, позволяет изучать онлайн-активность жителей региона с различных сторон. В рамках данной работы нами была предпринята попытка проанализировать мнения и настроения пользователей региональных сообществ Астраханской области в социальной сети ВКонтакте с использованием технологий машинного анализа текста (Text mining).
Следует отметить, что социальные сети являются самым популярным источником данных о самочувствии и качестве жизни, но не единственным. Другими источниками цифровых следов могут быть поисковые запросы пользователей (Algan & et al., 2019) или слова в Google Books (Hills & et al., 2019). Анализируя набор тематических работ, мы условно выделили три направления в исследованиях взаимосвязи социальных сетей и социально-политических настроений пользователей. Первое направление связано с использованием новых информационных технологий для анализа и обработки данных, которые могут служить источником информации в исследованиях благополучия пользователей. Примером может служить использование технологии автоматического распознавания эмоций человека на групповых изображениях в социальных сетях для определения индекса «счастья» (Dhall & et al., 2015).
Второе направление посвящено анализу социальных сетей как нового социального феномена, влияющего на различные стороны человеческого благополучия (Sabatini & Sarracino, 2017; Verduyn & et al., 2017). В данном случае социальные сети рассматриваются как значимый фактор, который может оказывать негативное или положительное влияние на такие параметры человеческого благополучия, как социальный капитал (Ciobanu & Androniceanu, 2018), удовлетворенность браком (Valenzuela & et al., 2014), депрессия (Appel & et al., 2016), одиночество (Song & et al., 2014), социальная поддержка (Lee & et al., 2013), оценка своей жизни как счастливой по сравнению с другими люди (Chou & Edge, 2012) и т.д.
Третье направление исследований рассматривает социальные сети как самодостаточный источник данных для оценки настроений пользователей. Принимая во внимание ту роль, которую социальные сети стали играть в повседневной жизни людей в последние десятилетия, попытки их всестороннего анализа стали весьма продуктивными (Haseeb & et al., 2019).
Можно отметить, что за последние десять лет количество исследований, в которых социальные сети являются основным источником информации о субъективном благополучии пользователей, быстро растет. При этом существенный вопрос заключается в том, насколько согласуются результаты цифровых и традиционных исследований благополучия и качества жизни и позволяют ли цифровые исследования прогнозировать «истинный» уровень благополучия.
Что же касается отечественного дискурса, то работы, посвященные анализу данных с применением машинного анализа текста, затрагивают в большинстве своем лишь теоретический аспект проблемы. Например, в работе О.В. Ярмак и Т.В. Жарковой рассмотрены преимущества и риски использования технологий работы с большими данными в перечисленных сферах на примере Испании и стран Ближнего Востока (Ярмак и др., 2022); К. Губа рассматривает перспективы использования больших данных в социологии (Губа, 2018); возможности и ограничения использования больших данных в социологии, в частности, в изучении городских пространств, проанализированы в работе А.В. Прокофьевой и М.Д. Романовой (Прокофьева & Романова, 2017). Однако в последние годы наблюдается появление отечественных публикаций, основанных на практических результатах исследований. К примеру, научная группа из Томского государственного университета на основе данных из школьных сообществ, взятых из социальной сети ВКонтакте, оценили настроения студенческого сообщества, связанные с переходом на дистанционное обучение в условиях пандемии, а также выявили динамику и основные тенденции в оценке удовлетворённости студентов качеством образовательного процесса (Богданова и др., 2022).
Таким образом, существующие на сегодняшний день различные зарубежные и российские методики измерения качества жизни, удовлетворенности и благополучия имеют как достоинства, так и недостатки. В нашей статье мы опираемся на работу коллектива Томского государственного университета (Щекотин и др., 2020), представляющуюся, на наш взгляд, довольно перспективной по причине учета именно российской специфики активности пользователей социальных сетей. Необходимо подчеркнуть тот факт, что в данной работе мы придерживаемся тезиса Дж. ван Дайка, полагающего, что «социальные сети воспроизводят те же процессы и явления, которые происходят в реальном мире, однако существенно их усиливая и интенсифицируя. Вследствие этого изучение социальных медиа предоставляет возможность получить вполне полное представление об оценке людьми условий своей жизни» (Van Dijk, 2006).
Основная цель работы – выявление мнений и настроений пользователей региональных сообществ Астраханской области в социальной сети ВКонтакте.
В соответствии с обозначенной целью были поставлены следующие задачи:
организовать процесс сбора и очистки данных, на основе разработанной ранее методики (Марьенков & Кривенко, 2022);
проанализировать полученный структурированный набор данных при помощи программных средств аналитики данных;
создать визуализацию полученных результатов в виде интерактивных дашбордов.
Использованные в рамках данной статьи методы работы с большими данными являются достаточно репрезентативными и могут быть использованы как самостоятельная методология в рамках выявления социальных настроений, позволяющая ситуативно анализировать текущую ситуацию в регионе.
Методологической основой данной работы является сетевой анализ, теоретической основой которого являются методы машинного анализа текста из социальных сетей и сообществ, дополненные социологическими методами.
Первый этап предполагает использование сетевого анализа для получения выборки данных в свободном доступе, генерируемых региональными онлайн-социальными сообществами на платформе социальной сети «ВКонтакте», которые являются основными производителями и потребителями необходимого для исследовательских целей контента. Каждое из этих социальных онлайн-сообществ стало плацдармом для жителей региона и площадкой для дискуссий. Будучи свободным от строгой модерации, сообщество в социальных сетях обеспечивает активное обсуждение и активное участие, поскольку пользователь может вынести на обсуждение любую тему публикации.
На втором этапе сетевой анализ усиливалась культурными компонентами социального действия (местными практиками и контекстами, дискурсами, репертуарами и нормами); поэтому традиционная методология математического анализа социальных сетей (т.е. структурный сетевой анализ) была дополнена методами реляционной социологии и лингводискурсивного анализа. Сетевой анализ, усиленный методами реляционной социологии, позволяет рассматривать социальные сети и сообщества, продуцирующие различный контент, как динамических акторов, осуществляющих управленческие операции через данный контент, а не инертных субъектов среди статичных узлов (Мальцева, 2014; Mische, 2011; Рябченко и др., 2019).
Первым этапом является оценка социальных медиа для определения релевантных сообществ, подлежащих анализу. В рамках доступности была выбрана социальная сеть ВКонтакте, так как она имеет открытый интерфейс прикладного программирования (Application programming interface, API) (Справочник API).
Оценка сообществ проводилась вручную. Сообщества отбирались по критериям:
в сообществе более 1000 участников;
периодичность публикаций не реже 1 раза в неделю;
отсутствие или минимальное количество рекламных постов;
информативная составляющая постов сообщества относится к вопросам Астраханской области.
Стоит подчеркнуть, что при рассмотрении задачи, локализованной под региональный контекст, следует учитывать особенности выбора именно региональных сообществ.
В качестве исходных данных выступили датасеты сообщений и комментариев из социальных сетей, взятых из 30 популярных сообществ Астраханской области в социальной сети ВКонтакте, за период с 06.04.2012 г. по 11.10.2022 г. Динамика сообщений по годам выглядит следующим образом (см. рис. 1.)
Рисунок 1. Динамика опубликованных сообщений Figure 1. Dynamics of published messages |
В исследовании использовались два набора данных: тексты постов в сообществах и тексты комментариев к постам. Исключались нерелевантные сообщения, не относящиеся к исследуемой тематической категории. Примеры сообществ представлены в Таблице 1.
Первичный набор данных составил 200 тысяч постов сообществ, структурированных в формате Excel. Сущности содержали следующие атрибуты: источник информации, дата публикации поста, текст поста, количество лайков, количество комментариев, количество репостов.
Собранные данные были рассмотрены, и на этапе очистки были выделены только уникальные тексты, проверена орфография и пунктуация, строки также были очищены с помощью запросов на языке PDL (Справка по PDL) и SRL (Справка по SRL) от «мусорных» данных для увеличения качества результатов контент-анализа. После очистки генеральная совокупность составила 80 тысяч кортежей.
Таблица 1. Выбор популярных сообществ Астраханской области
Table 1. Selection of popular communities of the Astrakhan region
На втором этапе изучалась проблема бинарной классификации, позволяющая различать тексты, классифицируемые по двум эмоциям П. Экмана: счастье и печаль, то есть все релевантные сообщения были отнесены к позитивным, негативным и нейтральным. Таким образом, внимание было сосредоточено на настроении, передаваемом пользователями в сообщениях. Все сообщения пользователей в отобранных сообществах были промаркированы в зависимости от их тональности. Надо отметить, что негативных записей в сети всегда больше, что типично для сетевых сообществ.
После отчистки данных мы перешли непосредственно к анализу текстовых данных. Исходя из задач исследования, мы применили следующие способы работы с данными: классификация текстов, формирование таксономий, извлечение сущностей, семантический поиск, категоризация, кластеризация, обнаружение паттернов и т.д. (Галоян & Ерохина). Для проверки гипотез можно использовать no-code платформы (Orange Data Mining, PolyAnalyst, Yandex DataLens, Gephi). В данном исследовании для анализа текстовых данных применялась платформа PolyAnalyst. Проект в системе PolyAnalyst представляет собой систему узлов, каждый из которых выполняет определенную функцию.
В сценарии для анализа данных из социальных медиа Астраханской области основной упор был сделан на определении тональности текста. Тональность выбрана стандартно-бинарная: положительная и отрицательная. Дополнительно выделялась основная мысль, проводился поиск ключевых тем и слов по встроенным словарям используемого инструмента. Это наиболее часто встречающиеся слова, достаточные, чтобы выявить основные тематики постов сообщества. Отдельными сущностями были выделены персоны, встречающиеся в корпусах текстов (см. Рис. 2).
Рисунок 2. Сценарий обработки данных в ПО PolyAnalyst Figure 2. Data processing scenario in PolyAnalyst software |
Распределение по сообщений по районам выглядит следующим образом (см. табл. 2).
Таблица 2. Распределение текстовых сообщений по районам
Table 2. Distribution of text messages by regions
В процессе данного анализа все релевантные данные были классифицированы по следующим категориям:
Таблица 3. Категории текстовых данных
Table 3. Categories of text data
Изучая сообщения пользователей, мы выделили две характерных особенности: достаточно большое количество негативных комментариев и огромное количество жалоб и просьб по многим вопросам, большинство из которых напрямую не относятся к компетенции руководителей районов области. Это, безусловно, свидетельствует о широких возможностях социальных сетей как инструмента обратной связи с населением.
Количественный анализ полученных данных позволил выделить перечень персон, наиболее часто упоминаемых в массиве текстовых сообщений (см. рис. 3.)
Рисунок 3. Облако тегов категории «Популярные персоны в области» Figure 3. Tag cloud of the category “Popular people in the region” |
В рамках данной статьи была дополнительно проанализирована тональность упоминаний 3-х наиболее популярных персон в регионе: И. Ю. Бабушкин (губернатор Астраханской области) – 2571 упоминание, М. Н. Пермякова (экс-глава МО «Город Астрахань») – 644 упоминания, О. А. Полумордвинов (глава МО «Город Астрахань») – 454 упоминания.
Исходя из графа упоминаний губернатора И. Ю. Бабушкина (см. рис. 4), мы установили наиболее тесные взаимосвязи с маркерами: региональный, жилье, казна, асфальт, инфраструктурный, торговля, переселение, нацпроект.
Рисунок 4. Граф упоминаний И.Ю. Бабушкин Figure 4. Graph of mentions by Igor Yu. Babushkin |
На наш взгляд, некоторые маркеры пересекаются с темами, обсуждаемыми пользователями, которые были обозначены выше: жилищный вопрос (жилье, переселение), состояние дорог (асфальт, нацпроект), состояние больниц и поликлиник (инфраструктурный). При этом тональность упоминаний в данных сообщениях в одинаковой степени как негативная, так и позитивная. В основном маркеры, имеющие отношение к выбранной персоне, имеют либо позитивную, либо нейтральную окраску; однако ряд маркеров имеет исключительно негативную тональность: замена асфальта, насущные проблемы сельчан, собачий, больница, электроснабжение, социальная инфраструктура и др. Связь данных маркеров с выбранной персоной, возможно, является попыткой пользователей привлечь внимание губернатора к решению данных проблем посредством упоминания его личности и описания проблемы в одном комментарии и/или сообщении.
Доминирующими сферами недовольства в ближнем круге упоминаний являются дороги, инфраструктура и льготное жилье. Примеры релевантных нарративов: «Людей бесят уже ямы на дорогах…»; «…нет транспорта, чтобы уехать после работы…»; «…горы мусора, которые никто не убирает»; «…ждем свою квартиру уже много лет, а власти все обещают…». В дальнем круге наибольшим недовольством обладают следующие маркеры: здравоохранение, водоснабжение, проблемы сельчан и собаки. Примеры релевантных нарративов: «когда начнут выделять лекарства?», «некомпетентные врачи в селах», «сломалась водокачка, никто не делает…», «за мной гналась стая собак», «...слишком много развелось бродячих собак».
Следующей наиболее упоминаемой в текстовых данных персоной стал нынешний глава МО «Город Астрахань» О.А. Полумордвинов. В данном случае анализ тональностей текстов показал негативную окраску практически по всем маркерам (см. рис. 5).
Рисунок 5. Граф упоминаний О. А. Полумордвинов Figure 5. Graph of mentions by Oleg A. Polumordvinov |
Среди проблем, высказанных пользователями городских сообществ, часто артикулируются проблемы с программой переселения из аварийных домов, вывозом мусора, недостаточным освещением дворов и улиц, прорванными трубами; главными объектами недовольства в этом контексте выступают управляющие организации и глава города, игнорирующие, по мнению пользователей социальных медиа, данные проблемы.
Возможно, подобное отношение пользователей к данной персоне связано с непродолжительным пребыванием в должности главы города (с 29 апреля 2022 г.), что отчасти подтверждается сравнением с графом упоминания предшественника (М. Н. Пермякова), где позитивная тональность текстов значительно выше (см. рис. 6). Нами также не исключается версия того, что такое отношение к деятельности нынешнего главы города вызвано неэффективностью его работы и, соответственно, недоверием жителей города к его персоне. Однако для подтверждения/опровержения данной гипотезы необходимо проведение дополнительных эмпирических работ, в частности, комплекс социологических исследований.
Рисунок 6. Граф упоминаний М.Н. Пермякова Figure 6. Graph of mentions by Mariya N. Permyakova |
В ходе выполнения следующего этапа исследования был построен Индекс субъективного (не)благополучия. В ходе выполнения следующего этапа исследования был построен Индекс субъективного (не)благополучия.
Дополнительно в рамках данной статьи авторами был построен Индекс субъективного (не)благополучия. Поскольку достаточно хорошо известно, что пользователи социальных медиа склонны активнее реагировать на сообщения негативной тональности (Trussler & Soroka, 2014; Liebrecht & et al., 2019), субъективная оценка фокусируется на сообщениях, содержащих отрицательную информацию. Таким образом, данный метод дает оценку скорее субъективному восприятию «неблагополучия» в регионе. Исследовательский коллектив под руководством Е. В. Щекотина назвали данный инструмент «индекс субъективного неблагополучия» (ИСНБ) (Щекотин и др., 2020).
Опираясь на их масштабное исследование, было принято решение применить разработанную ими формулу для расчета ИСНБ для районов Астраханской области:
где Ikjt – это величина Индекса субъективного неблагополучия для региона (k) по данному показателю субъективного благополучия (j) для определенной тональности сообщения t; Аkjt – показатель онлайн-активности в данном регионе по определенному показателю субъективного благополучия, который, в свою очередь, рассчитывается по формуле
Аkjt = L + 2C + 5R
где L – сумма лайков, которую собрали сообщения, относящиеся к определенному показателю субъективного благополучия, в данном регионе в определенной тональности; C – количество комментариев, которые собрали сообщения, относящиеся к определенному показателю субъективного благополучия, в данном регионе; R – количество репостов сообщений, относящихся к определенному показателю субъективного благополучия в данном регионе. Опираясь на исследование наших коллег, мы также приравнивали каждый комментарий к двум лайкам1, а репост к пяти лайкам2.
Bk – общее количество подписчиков во всех отобранных сообществах конкретного региона. Данный показатель позволяет нам оценить относительную величину онлайн активности для Астраханской области.
k – количество регионов (1).
j – категория (тематика) сообщения, т. е. компонент благополучия, который мы включили в модель субъективного благополучия (8, См. Табл. 3).
t – тональность сообщения (0, 1 или 2).
В рамках данного исследования был калькулирован индекс по каждому показателю и каждой тональности по годам, далее рассчитано среднегодовое значение по каждой категории и каждой тональности. Путем вычитания средних значений индекса для положительной и отрицательной тональности была определена средняя величина индекса субъективного благополучия ИСНБkj для каждого района области по конкретной тематике/показателю благополучия. Сообщения нейтральной тональности не использовались при расчете индекса субъективного благополучия. Итоговое значение индекса субъективного (не)благополучия ИСНБит рассчитывалось как сумма индекса по всем тематикам/показателям благополучия для каждого из районов Астраханской области.
На представленном ниже графике можно отметить, что наибольшее отрицательное значение индекса субъективного благополучия наблюдаются в следующих регионах: Приволжский район, Наримановский район и Ахтубинский район (см. Рис. 7).
Рисунок 7. Индекс субъективного (не)благополучия Астраханской области за 2022 г. (результаты умножены на 100 для удобства восприятия)3 Figure 7. Index of subjective (not) well-being of the Astrakhan region for 2022 (results multiplied by 100 for readability) |
На наш взгляд, отрицательный индекс в данных трёх регионах связан с различными проблемами районов в сфере коммунальных услуг: частые отключения электроэнергии, перебои с подачей воды населению муниципалитетов, а также ветхое состояние объектов инфраструктуры (Приволжский район); повешением стоимости проезда в общественном транспорте (Ахтубинский район), что послужило поводом для народного пикета в ноябре 2022 года; а основными проблемами Наримановского района являются: плохое состояние дорог и увеличение количества бродячих собак, что одновременно представляется насущной проблемой для всех районов области.
В рамках проведенного исследования по данным Астраханской области, собранным в социальной сети ВКонтакте, была также создана GIS-карта с визуализацией эмоциональной окраски постов с разбивкой на районы области (см. Рис. 8). Отметим, что данные эмоциональности постов с GIS-карты являются практически идентичными с данными ИСНБ, что может говорить о правильности рассчитанных нами данных с возможными незначительными отклонениями.
Рисунок 8. GIS-карта эмоциональной окраски постов из социальной сети ВКонтакте за 2022 год Figure 8. GIS-map of the emotional coloring of posts from the social network VKontakte for 2022 |
В результате проведенного анализа стало необходимо визуализировать полученные результаты для их наглядного представления; например, это вывод различных диаграмм, графиков, графов, облаков слов, тепловых карт, матриц. Платформа PolyAnalyst позволяет создавать интерактивные дашборды, с возможностью их интеграции на web-ресурсы пользователя. Поэтому в рамках данного исследования по данным Астраханской области, собранным в социальной сети ВКонтакте за 3 года, был также создан интерактивный дашборд, где были выведены: GIS-карта с визуализацией эмоциональной окраски постов с разбивкой на районы области, статистика положительной и отрицательной окраски постов в ретроспективе за последние 3 года, граф часто встречающихся слов, которые применяются по отношению к сущности «Астраханская область». Также отдельно были выделены популярные личности, которые упоминаются в постах.
Рисунок 9. Визуализация результатов анализа данных Figure 9. Visualization of data analysis results |
Данный отчёт является полностью интерактивным. Он позволяет подробнее увидеть статистику по каждому району, изучить частоту слов, встречающихся в тексте, настроить количество отображаемых узлов и связей графа. Расположение элементов отчёта выбирается администратором проекта.
Использование социальных медиа в целях обсуждения региональных проблем в настоящее время – необходимость, которую диктует информационное общество. Выход в онлайн-пространство является закономерным этапом развития публичного общественно-политического процесса. Уже сегодня предпринимаются попытки по адаптации различных методов и подходов к использованию социальных медиа в качестве инструмента государственного управления.
Возможности, которыми обладают социальные сети как канал взаимодействия власти с гражданами, чрезвычайно широки. Географическая маркировка сообщений, категоризация сообщений по темам, выявление актуальных региональных проблем, анализ отношения граждан к региональным политическим деятелям, а также идентификация информационных угроз – это примеры аспектов, которые могут быть полезными для целей государственного управления. Отдельное внимание сегодня уделяется решениям, основанным на методе мониторинга с последующей надстройкой различных технических возможностей. Такие разработки могут применяться не только для оценки активности граждан в социальных медиа, но и для повышения эффективности работы самих органов государственной власти.
В данной работе представлен относительно новый подход к анализу социальных настроений населения, а также к субъективной оценке благополучия с использованием данных социальных сетей и цифровых методов обработки данных. Измерение качества жизни населения на основе данных, публикуемых в социальных медиа, помогает своевременно фиксировать существующие социальные проблемы жителей регионов России и реагировать на них, в отличие от социологических опросов, которые требуют больше времени для сбора и анализа данных, что часто приводит к неактуальности полученных результатов.
Полученные результаты исследования можно использовать для мониторинга ситуации в регионе, определения проблемных районов, выявления лидеров мнений (популярных личностей региона, оказывающих особое влияние на мнение населения), а также определением наиболее интересующих население тем и актуальных проблем. Своевременное осведомление о происходящих изменениях поведения граждан, информированность о ситуации в регионе в настоящем моменте времени станет полезным инструментом не только для органов управления и власти, но и для исследователей различных сфер жизни общества. Система может быть усовершенствована автоматизацией добавления новых данных в аналитический проект. В перспективе, дополнение системы математическими моделями позволит создавать графики прогнозирования дальнейших изменений в регионе.
Исследование выполнено за счет гранта Российского научного фонда № 22-18-00301 «Процесс конструирования новых идентичностей в Каспийском макрорегионе в контексте социетальной безопасности».
The study was carried out by a grant from the Russian Science Foundation No. 22-18-00301 “The process of constructing new identities in the Caspian macroregion in the context of societal security”.
Ahmed, A., Scheepers, H., & Stockdale, R. (2014). Social Media Research: A Review of Academic Research and Future Research Directions. Pacific Asia Journal of the Association for Information Systems, 6, 1, 3. https://doi.org/10.17705/1pais.06102
Algan, Y., Murtin, F., Beasley, E., Higa, K., & Senik, C. (2019). Well-being through the lens of the Internet. PLoS ONE, 14(1), e0209562. https://doi.org/10.1371/journal.pone.0211586
Appel, H., Gerlach, A. L., & Crusius, J. (2016). The interplay between Facebook use, social comparison, envy, and depression. Current Opinion in Psychology, 9, 44-49. https://doi.org/10.1016/j.copsyc.2015.10.006
Beck, R., Pahlke, I., & Seebach, C. (2014). Knowledge exchange and symbolic action in social media-enabled electronic networks of practice: A multilevel perspective on knowledge seekers and contributors. MIS Quarterly, 38, 4, 1245-1270. https://doi.org/10.25300/MISQ/2014/38.4.14
Bellet, C., & Frijters, P. (2019). Big Data and Well-being. In Helliwell, J., Layard, R., Sachs, J. (Eds.), World Happiness Report 2019. New York: Sustainable Development Solutions Network, 97-122.
Chou, H.-T. G., & Edge, N. (2012).’They Are Happier and Having Better Lives than I Am’: The Impact of Using Facebook on Perceptions of Others’ Lives. Cyberpsychology, behavior, and social networking, 15(2), 117-121. https://doi.org/10.1089/cyber.2011.0324
Ciobanu A., & Androniceanu A. (2018). Integrated human resources activities – the solution for performance improvement in Romanian public sector institutions, Management Research and Practice, 10(3), 60-79.
Dhall, A., Goecke, R., & Gedeon, T. (2015). Automatic group happiness intensity analysis. IEEE Transactions on Affective Computing, 6(1), 13-26. https://doi.org/10.1109/TAFFC. 2015.2397456
Dickinger, A., Arami, M., & Meyer, D. (2008). The role of perceived enjoyment and social norm in the adoption of technology with network externalities. European Journal of Information Systems, 17, 1, 4–11. https://doi.org/10.1057/palgrave.ejis.3000726
Durahim, A.O., & Coşkun, M. (2015). # iamhappybecause: Gross National Happiness through Twitter analysis and big data. Technological Forecasting and Social Change, 99, 92–105. https://doi.org/10.1016/j.techfore.2015.06.035 0040-1625
Hao, B., Li, L., Gao, R., Li, A., & Zhu, T. (2014). Sensing Subjective Well-Being from Social Media. In Ślȩzak, D., Schaefer, G., Vuong, S.T., Kim, Y.S. (Eds.), Active Media Technology. AMT 2014. Lecture Notes in Computer Science, vol 8610. Springer, Cham, 324-335. https://doi.org/10.1007/978-3-319-09912-5_27
Haseeb, M., Hussai, H.I., Kot, S., Androniceanu, A., & Jermsittiparsert, K. (2019). Role of social and technological challenges in achieving a sustainable competitive advantage and sustainable business performance. Sustainability, 11(14), 3811. https://doi.org/10.3390/su11143811
Hills, T., Proto, E., & Sgroi, D. (2019). Historical analysis of national subjective well-being using millions of digitized books. Nature: Human Behaviour, 3 (12), 1271-1275. https://doi.org/10.1038/s41562-019-0781-5
Lee, K.-T., Noh, M.-J., & Koo, D.-M. (2013). Lonely people are no longer lonely on social networking sites: The mediating role of self-disclosure and social support. Cyberpsychology, Behavior, and Social Networking, 16 (6), 413-418. https://doi.org/10.1089/cyber.2012.0553
Leonardi, P.M. (2015). Ambient Awareness and Knowledge Acquisition: Using Social Media to Learn “Who Knows What” and “Who Knows Whom”. MIS Quarterly, 39, 4, 747–762. https://doi.org/10.25300/MISQ/2015/39.4.1
Liebrecht, C., Hustinx, L., & Van Mulken, M. (2019). The relative power of negativity: the influence of language intensity on perceived strength. Journal of Language and Social Psychology, 38, 2, 170-193. https://doi.org/10.1177/0261927X18808562
Mische, A. (2011). Relational Sociology. Culture, and Agency. In J. G. Scott, P. J. Carrington (Eds.) The SAGE Handbook of Social Network Analysis. SAGE Publications, 80-98.
Smetanin, S. (2020). The Applications of Sentiment Analysis for Russian Language Texts: Current Challenges and Future Perspectives. IEEE Access, 8, 110693-110719. https://doi.org/10.1109/ACCESS.2020.3002215
Sabatini, F., & Sarracino, F. (2017). Online Networks and Subjective Well‐Being. Kyklos, 70(3), 456-480. https://doi.org/10.1111/kykl.12145
Schwartz, H.A., Sap, M., Kern, M.L., Eichstaedt, J.C., Kapelner, A., Agrawal, M., Blanco, E., Dziurzynski, L., Park, G., Stillwell, D., Kosinski, M., Seligman, M.E., & Ungar, L.H. (2016). Predicting individual well-being through the language of social media. Pacific Symposium on Biocomputing, 21, 516‑527. https://doi.org/10.1142/97898147 49411_0047
Song, H., Zmyslinski-Seelig, A., Kim, J., Drent, A., Victor, A., Omori, K., & Allen, M. (2014). Does Facebook make you lonely?: A meta analysis. Computers in Human Behavior, 36, 446-452. https://doi.org/10.1016/j.chb.2014.04.011
Trussler, M., & Soroka, S. (2014). Consumer demand for cynical and negative news frames. The International Journal of Press. Politics, 19, 3, 360-379. https://doi.org/10.1177/1940161214524832
Valenzuela, S., Halpern, D., & Katz, J.E. (2014). Social network sites, marriage well-being and divorce: Survey and state-level evidence from the United States. Computers in Human Behavior, 36, 94-101. https://doi.org/10.1016/j.chb.2014.03.034
Van Dijk, J. (2006). The network society. social aspects of new media. London, SAGE Publ., 300 p.
Verduyn, P., Ybarra, O., Resibois, M., Jonides, J., & Kross, E. (2017). Do social network sites enhance or undermine subjective well‐being? A critical review. Social Issues and Policy Review, 11(1), 274‑302. https://doi.org/10.1111/sipr.12033
Wu, K., Ma, J., Chen, Z., & Ren, P. (2015). Analysis of Subjective City Happiness Index Based on Large Scale Microblog Data. In Cheng, R., Cui, B., Zhang, Z., Cai, R., & Xu, J. (Eds.), Web Technologies and Applications. APWeb 2015. Lecture Notes in Computer Science, 9313. Springer, Cham, 365‑377. https://doi.org/10.1007/978-3-319-25255-1_30
Абдуллаева, Р.А. (2015). Анализ влияния социальных сетей на жизнь современного общества. Международный журнал прикладных и фундаментальных исследований, 9 (3), 542-546.
Беленкова, Л.М., & Белоконев, С.Ю. (2020). Социальные сети в информационной политике: формирование имиджа федеральных органов исполнительной власти. Гражданин. Выборы. Власть, 1(15), 92-102.
Богданова, А.В., Александрова, Ю.К., Орлова, В.В., Петров, Е.Ю., & Глазова, В.Ф. (2022). Исследование динамики мнений студентов в условиях перехода к онлайн-обучению на основе данных социальных сетей. Высшее образование в России, 31, 6, 77–91. https://doi.org/10.31992/0869-3617-2022-31-6-77-91
Галоян, О. Т., & Ерохина, Е.В. (2020). Методы и техники анализа больших данных. Тенденции развития науки и образования, 62-10, 24-27.
Губа, Е. (2018). Большие данные в социологии: новые данные, новая социология? Социологическое обозрение, 17, 1, 213-236.
Есиев, Э.Т. (2021). Интернет-технологии политической мобилизации в белорусских протестах на предвыборном этапе. Вестник Московского государственного областного университета, 2, 23-37. https://doi.org/10.18384/2224-0209-2021-2-1067
Зимова, Н.С., Фомин, Е.В., & Смагина А.А. (2020). Социальные сети как новый канал взаимодействия общества и власти. Научный результат. Социология и управление, 2, 159-171.
Мальцева, Д.В. (2014). Реляционная социология: новый этап в развитии анализа социальных сетей или самостоятельное направление? Мониторинг, 4(122), 3-14. https://doi.org/10.14515/monitoring.2014.4.01
Марьенков, А.Н., & Кривенко, А.И. (2022). Сбор и обработка текстовых данных в контексте оценки социальных настроений: методологические аспекты. Инженерный вестник Дона, 7(91),101-120.
Прокофьева, А.В., & Романова, М.Д. (2017). О некоторых вопросах использования больших данных в урбанистической социологии. Актуальные проблемы развития человеческого потенциала в современном обществе. Пермь: Пермский государственный университет.
Рябченко, Н.А., Гнедаш, А.А., Малышева, О.П., Шестакова, А.А., & Николаева, М.В. (2019). Социально-политический контент и региональный дискурс в современной России: что обсуждают граждане в online-пространстве, и что предлагают кандидаты на пост губернатора в предвыборных программах (точки пересечения и линии разлома). Южно-российский журнал социальных наук, 20, 4, 27-48. https://doi.org/10.31429/26190567-20-4-27-48
Справка по PDL. https://pa.data.tsu.ru:5043/polyanalyst/help/rus/15_PDL_ reference/toc.html
Справка по SRL. https://pa.data.tsu.ru:5043/polyanalyst/help/rus/14_SRL_reference/toc.html
Справочник API. https://dev.vk.com/reference/roadmap
Щекотин, Е.В., Коварж, Г.Ю., Гойко, В.Л., Петров, Е.Ю., & Бакулин, В.В. (2020). Оценка качества жизни населения регионов РФ на основе цифровых данных: методологические аспекты. Векторы благополучия: экономика и социум, 3(38), 138-156. https://doi.org/10.18799/26584956/2020/3(38)/1020
Ярмак, О.В., Жаркова, Т.В., & Саркисов, Д.Г. (2022). Использование больших данных в междисциплинарных исследованиях на примере макрорегиона Большое Средиземноморье. Цифровая социология, 5, 3, 24–30. https://doi.org/10.26425/2658-347X-2022-5-3-24-30
Abdullaeva, R.A. (2015). Analysis of the impact of social networks on the life of modern society. International Journal of Applied and Basic Research, 9(3), 542-546. (In Russian).
Ahmed, A., Scheepers, H., & Stockdale, R. (2014). Social Media Research: A Review of Academic Research and Future Research Directions. Pacific Asia Journal of the Association for Information Systems, 6, 1, 3. https://doi.org/10.17705/1pais.06102
Algan, Y., Murtin, F., Beasley, E., Higa, K., & Senik, C. (2019). Well-being through the lens of the Internet. PLoS ONE, 14(1), e0209562. https://doi.org/10.1371/journal.pone.0211586
API Reference. https://dev.vk.com/reference/roadmap (In Russian).
Appel, H., Gerlach, A. L., & Crusius, J. (2016). The interplay between Facebook use, social comparison, envy, and depression. Current Opinion in Psychology, 9, 44-49. https://doi.org/10.1016/j.copsyc.2015.10.006
Beck, R., Pahlke, I., & Seebach, C. (2014). Knowledge exchange and symbolic action in social media-enabled electronic networks of practice: A multilevel perspective on knowledge seekers and contributors. MIS Quarterly, 38, 4, 1245-1270. https://doi.org/10.25300/MISQ/2014/38.4.14
Belenkova, L.M., & Belokonev, S.Yu. (2020). Social networks in information policy: formation of the image of federal executive authorities. Citizen. Elections. Power, 1(15), 92-102. (In Russian).
Bellet, C., & Frijters, P. (2019). Big Data and Well-being. In Helliwell, J., Layard, R., Sachs, J. (Eds.), World Happiness Report 2019. New York: Sustainable Development Solutions Network, 97-122.
Bogdanova, A.V., Aleksandrova, Yu.K., Orlova, V.V., Petrov, E.Yu., & Glazova, V.F. (2022). Study of the dynamics of students' opinions in the context of the transition to online learning based on social network data. Higher education in Russia, 31, 6, 77–91. https://doi.org/10.31992/0869-3617-2022-31-6-77-91 (In Russian).
Chou, H.-T. G., & Edge, N. (2012).’They Are Happier and Having Better Lives than I Am’: The Impact of Using Facebook on Perceptions of Others’ Lives. Cyberpsychology, behavior, and social networking, 15(2), 117-121. https://doi.org/10.1089/cyber.2011.0324
Ciobanu A., & Androniceanu A. (2018). Integrated human resources activities – the solution for performance improvement in Romanian public sector institutions, Management Research and Practice, 10(3), 60-79.
Dhall, A., Goecke, R., & Gedeon, T. (2015). Automatic group happiness intensity analysis. IEEE Transactions on Affective Computing, 6(1), 13-26. https://doi.org/10.1109/TAFFC. 2015.2397456
Dickinger, A., Arami, M., & Meyer, D. (2008). The role of perceived enjoyment and social norm in the adoption of technology with network externalities. European Journal of Information Systems, 17, 1, 4–11. https://doi.org/10.1057/palgrave.ejis.3000726
Durahim, A.O., & Coşkun, M. (2015). # iamhappybecause: Gross National Happiness through Twitter analysis and big data. Technological Forecasting and Social Change, 99, 92–105. https://doi.org/10.1016/j.techfore.2015.06.035 0040-1625
Esiev, E.T. (2021). Internet technologies of political mobilization in Belarusian protests at the pre-election stage. Bulletin of the Moscow State Regional University, 2, 23-37. https://doi.org/10.18384/2224-0209-2021-2-1067 (In Russian).
Galoyan, O. T., & Erokhina, E.V. (2020). Methods and techniques for big data analysis. Trends in the development of science and education, 62-10, 24-27. (In Russian).
Guba, E. (2018). Big data in sociology: new data, new sociology? Sociological Review, 17, 1, 213-236. (In Russian).
Hao, B., Li, L., Gao, R., Li, A., & Zhu, T. (2014). Sensing Subjective Well-Being from Social Media. In Ślȩzak, D., Schaefer, G., Vuong, S.T., Kim, Y.S. (Eds.), Active Media Technology. AMT 2014. Lecture Notes in Computer Science, vol 8610. Springer, Cham, 324-335. https://doi.org/10.1007/978-3-319-09912-5_27
Haseeb, M., Hussai, H.I., Kot, S., Androniceanu, A., & Jermsittiparsert, K. (2019). Role of social and technological challenges in achieving a sustainable competitive advantage and sustainable business performance. Sustainability, 11(14), 3811. https://doi.org/10.3390/su11143811
Hills, T., Proto, E., & Sgroi, D. (2019). Historical analysis of national subjective well-being using millions of digitized books. Nature: Human Behaviour, 3 (12), 1271-1275. https://doi.org/10.1038/s41562-019-0781-5
Lee, K.-T., Noh, M.-J., & Koo, D.-M. (2013). Lonely people are no longer lonely on social networking sites: The mediating role of self-disclosure and social support. Cyberpsychology, Behavior, and Social Networking, 16 (6), 413-418. https://doi.org/10.1089/cyber.2012.0553
Leonardi, P.M. (2015). Ambient Awareness and Knowledge Acquisition: Using Social Media to Learn “Who Knows What” and “Who Knows Whom”. MIS Quarterly, 39, 4, 747–762. https://doi.org/10.25300/MISQ/2015/39.4.1
Liebrecht, C., Hustinx, L., & Van Mulken, M. (2019). The relative power of negativity: the influence of language intensity on perceived strength. Journal of Language and Social Psychology, 38, 2, 170-193. https://doi.org/10.1177/0261927X18808562
Maltseva, D.V. (2014). Relational sociology: a new stage in the development of social network analysis or an independent direction? Monitoring, 4(122), 3-14. https://doi.org/10.14515/monitoring.2014.4.01 (In Russian).
Mar'enkov, A.N., & Krivenko, A.I. (2022). Collection and processing of textual data in the context of social sentiment assessment: methodological aspects. Engineering Bulletin of the Don, 7(91), 101-120.
Mische, A. (2011). Relational Sociology. Culture, and Agency. In J. G. Scott, P. J. Carrington (Eds.) The SAGE Handbook of Social Network Analysis. SAGE Publications, 80-98.
PDL Help. https://pa.data.tsu.ru:5043/polyanalyst/help/rus/15PDLreference/toc. html (In Russian).
Prokofiev, A.V., & Romanova, M.D. (2017). On some issues of using big data in urban sociology. Actual problems of human development in modern society. Perm: Perm State University. (In Russian).
Ryabchenko, N.A., Gnedash, A.A., Malysheva, O.P., Shestakova, A.A., & Nikolaeva, M.V. (2019). Socio-political content and regional discourse in modern Russia: what citizens discuss online and what candidates for governor propose in their election programs (intersection points and fault lines). South Russian Journal of Social Sciences, 20, 4, 27-48. https://doi.org/10.31429/26190567-20-4-27-48 (In Russian).
Sabatini, F., & Sarracino, F. (2017). Online Networks and Subjective Well‐Being. Kyklos, 70(3), 456-480. https://doi.org/10.1111/kykl.12145
Schwartz, H.A., Sap, M., Kern, M.L., Eichstaedt, J.C., Kapelner, A., Agrawal, M., Blanco, E., Dziurzynski, L., Park, G., Stillwell, D., Kosinski, M., Seligman, M.E., & Ungar, L.H. (2016). Predicting individual well-being through the language of social media. Pacific Symposium on Biocomputing, 21, 516‑527. https://doi.org/10.1142/97898147 49411_0047
Shchekotin, E.V., Kovarzh, G.Yu., Goiko, V.L., Petrov, E.Yu., & Bakulin, V.V. (2020). Assessment of the quality of life of the population of the regions of the Russian Federation on the basis of digital data: methodological aspects. Vectors of well-being: economics and society, 3(38), 138‑156. https://doi.org/10.18799/26584956/2020/3(38)/1020 (In Russian).
Smetanin, S. (2020). The Applications of Sentiment Analysis for Russian Language Texts: Current Challenges and Future Perspectives. IEEE Access, 8, 110693-110719. https://doi.org/10.1109/ACCESS.2020.3002215
Song, H., Zmyslinski-Seelig, A., Kim, J., Drent, A., Victor, A., Omori, K., & Allen, M. (2014). Does Facebook make you lonely?: A meta analysis. Computers in Human Behavior, 36, 446-452. https://doi.org/10.1016/j.chb.2014.04.011
SRL Help. https://pa.data.tsu.ru:5043/polyanalyst/help/rus/14_SRL_reference/toc. html (In Russian).
Trussler, M., & Soroka, S. (2014). Consumer demand for cynical and negative news frames. The International Journal of Press. Politics, 19, 3, 360-379. https://doi.org/10.1177/1940161214524832
Valenzuela, S., Halpern, D., & Katz, J.E. (2014). Social network sites, marriage well-being and divorce: Survey and state-level evidence from the United States. Computers in Human Behavior, 36, 94-101. https://doi.org/10.1016/j.chb.2014.03.034
Van Dijk, J. (2006). The network society. social aspects of new media. London, SAGE Publ., 300 p.
Verduyn, P., Ybarra, O., Resibois, M., Jonides, J., & Kross, E. (2017). Do social network sites enhance or undermine subjective well‐being? A critical review. Social Issues and Policy Review, 11(1), 274‑302. https://doi.org/10.1111/sipr.12033
Wu, K., Ma, J., Chen, Z., & Ren, P. (2015). Analysis of Subjective City Happiness Index Based on Large Scale Microblog Data. In Cheng, R., Cui, B., Zhang, Z., Cai, R., & Xu, J. (Eds.), Web Technologies and Applications. APWeb 2015. Lecture Notes in Computer Science, 9313. Springer, Cham, 365‑377. https://doi.org/10.1007/978-3-319-25255-1_30
Yarmak, O.V., Zharkova, T.V., & Sarkisov, D.G. (2022). The use of big data in interdisciplinary research on the example of the Greater Mediterranean macroregion. Digital Sociology, 5, 3, 24–30. https://doi.org/10.26425/2658-347X-2022-5-3-24-30 (In Russian).
Zimova, N.S., Fomin, E.V., & Smagina A.A. (2020). Social networks as a new channel for interaction between society and government. scientific result. Sociology and Management, 2, 159-171. (In Russian).
1Лайк – это активное действие пользователя, которое свидетельствует об особой актуальности тематики поста для комментатора. В этом случае лайк – это пассивная форма выражения поддержки данного сообщения (см: Щекотин и др., 2020).
2Репост свидетельствует о полной и активной поддержке пользователем данной публикации. Такое действие означает, что пользователь не просто выражает свое согласие с сообщением, но и публично демонстрирует среди своих друзей и подписчиков свою солидарность (см: Щекотин и др., 2020).
3Из расчетов были удалены данные из ЗАТО Знаменск по причине слишком малого количества данных, что делает результаты данного района нерепрезентативными