СИБАС - Русская региональная ассоциативная база данных (Сибирь и Дальний Восток) - 2008-2020 гг.

Русская региональная ассоциативная база данных (СИБАС), собираемых в азиатских регионах РФ (в Сибири и на Дальнем Востоке), представляет собой продукт реализации комплексных междисциплинарных проектов, направленных на исследование русского языкового сознания. Базовая часть этих проектов выполняется исследовательской группой в секторе русского языка в Сибири Института филологии СО РАН и НГУ в сотрудничестве с академическими институтами (преимущественно ИЯз РАН), центрами и лабораториями, а также заинтересованными вузами России.

Описание СИБАС

СИБАС содержит обновляемый и пополняемый основной корпус и подкорпусы. Подкорпусы создаются для решения конкретных задач в рамках локальных исследований. В 2018 году для пользователей был открыт ПВАС – Подкорпус ассоциаций военных. В 2019 году – РКАС – Подкорпус вербальных ассоциаций носителей русского языка в Казахстане. Весь массив вербальных ассоциаций, представленных в СИБАС, получен на основе массовых ассоциативных экспериментов в азиатских регионах РФ и на сопредельных территориях в разные годы, начиная с 2008.

В структуре основного корпуса ассоциаций и подкорпусов СИБАС две части: 1) массив эмпирических (полученных экспериментальным путем) данных (в открытом доступе для пользователя); 2) информативно-исследовательская часть, которая включает в себя информацию об уже завершенных и текущих проектах, в которых используются эмпирические материалы СИБАС. Обе части постоянно обновляются по мере накопления новых данных и результатов реализации конкретных проектов. Готовые в настоящее время для использования эмпирические материалы представлены на сайте в виде (расширенных за счет электронного инструментария оперирования данными) ассоциативных словарей (прямого и обратного) базового корпуса и словарей подкорпусов. В них отражаются полностью обработанные данные того периода времени, когда проводился соответствующий эксперимент (эксперименты). Поэтому ресурс СИБАС в настоящее время нельзя свести к имеющимся в ней словарям. Его обновляемая часть содержит новые экспериментальные данные, которые находятся в процессе накопления и обработки и будут выставляться на сайте в свободном для исследователей доступе по мере завершения отдельных этапов новых экспериментов и подготовки материалов для пользователя. Кроме того, авторы и исследовательская группа проекта проводят работу по оптимизации уже имеющихся данных. Оптимизация представляет собой частичный аналог профессиональной лингвистической разметки (аннотирования) корпуса, с предоставлением пользователю возможности оперировать уточняющей, поясняющей характер ассоциатов и их связей информацией.

Совместимость СИБАС с существующими базами и корпусами

СИБАС и его подкорпусы включают параметры описания, принципиально совместимые с уже существующими русскими (www.tesaurus.ru/dict/dict.php), английскими (www.eat.rl.ac.uk), французскими (http://dictaverf.nsu.ru/) и др. ассоциативными базами, что позволит использовать СИБАС в сравнительно-сопоставительных и междисциплинарных исследованиях.

С 2018 года пользователи могут осуществлять прямой выход из ассоциативных полей прямого словаря СИБАС на контекстный ресурс Национального корпуса русского языка (НКРЯ, http://www.ruscorpora.ru/new/). Для этого необходимо, войдя в ассоциативное поле интересующего пользователя слова-стимула, просто подвести курсор к нужному ассоциату в этом поле и кликнуть, осуществив таким образом выход в поисковую систему НКРЯ. Эта операция выведет на экран результаты поиска контекстов при наличии заданной конфигурации соответствующих вербальных единиц в НКРЯ.

Из истории проекта

Общероссийский проект создания нового русского ассоциативного тезауруса был разработан в Институте языкознания РАН при поддержке РГНФ (грант № 12-04- 12059в «Информационная исследовательская база современного русского языка по материалам массового ассоциативного эксперимента», руководитель: д-р филол. наук, проф., руководитель сектора этнопсихолингвистики Института языкознания РАН Наталья Владимировна Уфимцева). На создание такого словаря-тезауруса нацелен наиболее крупный эксперимент, первый этап которого уже закончен и отражен в созданных и опубликованных словарях (см. список публикаций ниже, а также на сайте ИЯз РАН). С этого эксперимента начиналась работа над региональными базами: СИБАС (Сибирь и Дальний восток), ЕВРАС (Европейская часть России) и УрРАС (Уральский регион).

Представленные в опубликованных книжных версиях словарей данные соответствуют результатам эксперимента 2008 – 2013 гг. По мере продолжения экспериментальной работы и аккумуляции новых данных региональные словари (ЕВРАС, УрРАС и СИБАС) будут включать в себя результаты трех этапов массового ассоциативного эксперимента.

Первый этап эксперимента в рамках СИБАС

Результаты первого этапа общероссийского ассоциативного эксперимента в азиатских регионах РФ в полной мере доступны пользователю (всего было получено 5011 анкет) в основном корпусе СИБАС.

Подготовка эксперимента. В Институте языкознания РАН для восточных регионов страны был подготовлен список стимулов первого эксперимента и 5000 анкет (при технической компьютерной поддержке Г.А. Черкасовой) по сто стимулов в каждой (список стимулов для этого этапа составил 1000 единиц).

Проведение эксперимента. Основной эксперимент проводился с 2008 по 2013 год в наиболее крупных городах азиатской части России – Новосибирске, Омске, Красноярске, Томске и Северске, Новокузнецке, Барнауле, Кемерово, Владивостоке, Хабаровске, Чите и Иркутске. Небольшая часть анкет после отбраковки была заменена новыми в проведенном для этой цели дополнительном эксперименте 2012–2013 годов. Экспериментальные материалы направлялись в каждый регион с учетом демографических особенностей на местах (общее количество проживающих в регионе и доля студентов). В качестве испытуемых выступали студенты преимущественно в следующих возрастных категориях: основная масса от 17 до 19 лет; значительная доля испытуемых (от одной шестой до одной четверти в разных регионах) в возрасте от 20 до 22 и небольшое количество от 23 до 25 лет. Единичные случаи – в возрасте 16 лет или старше 25, но не старше 30 лет. Все испытуемые – студенты. В базе имеются данные о половой принадлежности испытуемых, об их профессиональной специализации и о конкретных регионах – местах проживания и обучения.

В азиатской части эти экспериментальные данные аккумулировались и обрабатывались сначала на кафедре истории и типологии языков и культур Новосибирского государственного университета (ранее в лаборатории этнопсихолингвистики НИЧ НГУ), в настоящее время в секторе русского языка в Сибири Института филологии СО РАН. Экспериментальная работа в азиатской части была организована на базе НГУ и ИФЛ СО РАН с участием ряда крупных вузов Сибири и Дальнего Востока (см. информацию о региональных участниках проекта).

Второй этап эксперимента в рамках СИБАС

Эксперимент второго этапа включает новых участников, его результаты пока ещё не доступны для широкого круга пользователей. С 2014 года ведётся сбор и обработка экспериментальных материалов, формируется новая, значительно расширенная база данных. Для эксперимента второго этапа в системе СИБАС было сгенерировано 8000 анкет (из реакций, полученных на первом этапе). Получение материалов второго этапа направлено не только на наращивание базы, но и на фиксацию динамики смысловых акцентуаций при развёртывании ассоциативно-вербальной сети в актуальной диахронии.

Второй этап запущен как в электронном дистанционном формате (см. раздел ЭКСПЕРИМЕНТЫ), так и в традиционном контактном с предъявлением анкет для заполнения в студенческой аудитории, в зависимости от условий на местах. В 2018 году начато формирование банка данных, включающего прошедшие первичную обработку и редактирование новые экспериментальные материалы. Завершение подготовительных работ к открытию этого нового ресурса для пользователя планируется в 2021 году.

Инструментарий СИБАС: прямой и обратный словари, подкорпусы, экспертное приложение, разметка

Словари. Представленные в СИБАС в открытом доступе эмпирические материалы могут использоваться автономно в режиме прямого и обратного словаря. Для этого на сайте имеется необходимый инструментарий (см. описание словаря и  список стимулов).

Подкорпусы. Развитие СИБАС подразумевает не только накопление данных описанного выше самого большого эксперимента по общероссийскому проекту. Оно также предполагает расширение эмпирического массива за счет локальных экспериментальных данных, полученных исследователями под конкретные задачи того или иного азиатского региона и отражающих ту или иную специфику испытуемых. Эти локальные данные организованы в виде автономных подсистем (подкорпусов), специфика которых (при её наличии) теоретически должна проявиться на фоне общих (эталонных) данных СИБАС. Первым таким подкорпусом стал ПВАС (разработан в рамках исследования профессиональной идентификации военных Р.А.Кафтановым). Некоторые результаты уже проведенных исследований такого плана отражены в статьях (см. список публикаций ниже). Подкорпус ПВАС (доступен в режиме словарей, а с 2019 года и для работы в Приложении).

С 2019 года ведется разработка и отладка экспертного обучающего приложения к СИБАС. Работы по оптимизации СИБАС, включающие в себя создание и отладку Приложения, ряда Подкорпусов и их апробацию в Приложении, осуществление исследовательских работ на основе полученных в целевых локальных экспериментах данных, при их обработке с использованием Приложения и всего инструментария СИБАС, а также комплекс работ по разметке СИБАС с 2019 года проводятся в рамках проекта Института филологии СО РАН «Культурные универсалии вербальных традиций народов Сибири и Дальнего Востока: фольклор, литература, язык» по гранту Правительства РФ для государственной поддержки научных исследований, проводимых под руководством ведущих ученых (соглашение № 075-15-2019-1884).

Приложение. Разработано и подготовлено И.В.Шапошниковой (техническое сопровождение – Н.Ю.Зятьков). Экспертное обучающее приложение представляет собой программу для предварительного статистического анализа представленных в СИБАС эмпирических материалов. С его помощью пользователь может анализировать любое из ассоциативных полей, имеющихся в прямом или обратном словарях основного корпуса и подкорпусов СИБАС. Анализ позволяет получить психоглоссы разного типа в зависимости от поставленных пользователем задач. Приложение оснащено справочными материалами: руководством по выявлению психоглосс и глоссарием терминов. По мере введения в базу новых подкорпусов, осуществления разметки, фиксации вариативности единиц ассоциативно-вербальной сети и расширения исследовательских задач предполагается соответствующее расширение функциональных параметров экспертного Приложения. Скачать Приложение и базы данных (основной корпус или подкорпусы) для автономной работы можно по ссылке.

Разметка. Разработка и апробация подходов к разметке СИБАС проводится канд. физ-мат. наук Т.В.Батура. В 2019-2020 годах проведена частеречная разметка всего массива ассоциатов СИБАС, полученных по результатам первого этапа экспериментальной работы. Более подробную информацию об этом сервисе можно получить здесь.

Подкорпус РКАС. Создан и оптимизируется в рамках исследования мл.науч. сотрудника Е.В.Бентя. Доступен в режиме словаря и для работы в Приложении.

Текст подготовлен И.В.Шапошниковой и М.А.Кузьминой. Обновлен 12.01.2019

Как сослаться на СИБАС?

Образец ссылки на Русскую региональную ассоциативную базу данных (СИБАС):
СИБАС – Русская региональная ассоциативная база данных (2008 – 2020) (авторы-составители И.В.Шапошникова, А.А.Романенко) URL:http://adictru.nsu.ru

Образец ссылки на Подкорпус ассоциаций военных:
ПВАС (2015 - 2018) – Подкорпус ассоциаций военных (авторы-составители Р.А.Кафтанов, А.А.Романенко). URL:http://adictru.nsu.ru

Образец ссылки на Подкорпус вербальных ассоциаций носителей русского языка в Казахстане (РКАС):
РКАС (2017 – 2020) – Подкорпус вербальных ассоциаций носителей русского языка в Казахстане (авторы-составители Бентя Е.В., Романенко А.А.) URL:http://adictru.nsu.ru

Публикации по проектам, выполненным на материалах СИБАС

Словари

(Внимание! В электронных версиях словарей, в отличие от представленных ниже книжных версий, можно получить более детальную информацию о группах испытуемых и о макропараметрах ассоциативно-вербальной сети.)

Статьи в научных журналах и сборниках научных трудов

Facebook VK Google LinkedIn