Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Статистические методы в социолингвистических исследованиях



Социолингвистика

Изучает воздействие социальной среды на язык и речевое поведение людей, а также языка на социальную среду.

Объект социолингвистики – язык в его функционировании. Язык функционирует в обществе, обладающем определенной социальной структурой, поэтому социолингвистика – наука, исследующая язык в социальном контексте.

Предмет социолингвистики – широкий круг вопросов:

социальная дифференциация языка,

взаимосвязи между языковыми и социальными структурами,

типология языковых ситуаций, определяемых социальными факторами,

взаимодействие языковых и национальных факторов,

социальные аспекты многоязычия,

вопросы языковой политики

… …

Обработка статистических результатов в социолингвистике
[Беликов, Крысин, 2001]

Методы социолингвистики

Наблюдение

Устное интервью

Анкетирование

Тестирование

Социолингвистически значимые данные можно почерпнуть из письменных текстов различной стилистической и жанровой принадлежности:

СМИ

переписка

деловая коммуникация

социолингвистические аспекты художественных текстов

… …

Корпус как источник социолингвистических данных. Вопросы использования и интерпретации. Дискуссия.

 

И классические, и современные методы предполагают статистическую обработку данных.

Обработка статистических данных

Выявление объективно существующих закономерностей.

Определение круга лиц, для которых значение социолингвистической переменной релевантно.

Нередко этот круг лиц выявляется только в результате анализа анкеты. Пример из [Беликов, Крысин, 2001], [Михальченко 1975]:

Опрос жителей практически полностью двуязычной литовско-русской деревни Дегучяй (245 человек, из них 62% литовцы, 34% русские), проведенный в начале 1970-х гг.:

96% смотрели фильмы на обоих языках

книги на втором языке читали лишь 22% из тех, кто пользовался библиотекой

выясняется, что письменной формой второго языка владели 93% лиц в возрасте 19-30 лет и лишь 4% лиц старше 51 года

читающих на обоих языках мало в первую очередь потому, что представители старших когорт грамотны лишь на родном языке.

Обработка статистических данных

По каждому разрабатываемому вопросу важно четко различать:

отсутствие явления,

неприменимость вопроса к какой-либо категории респондентов,

отсутствие данных (например, ввиду неполного заполнения вопросника).

Не смешивать последние с ответами тех, кто затруднился ответить.

Учитывая эти факторы, исследователь приступает к обработке результатов по каждому вопросу анкеты.

Шкалирование данных

Статистические измерения с различным уровнем точности:

Номинальная шкала

Порядковая шкала

Интервальная шкала

Количественная шкала

Номинальная шкала

Классификация данных с указанием, к какой группе они принадлежат

Значениям «мужской пол»/«женский пол» (ответам типа «да»/«нет») могут быть присвоены как значения 0-1, так и значения 1-0 или 2-1, за числами не скрывается ничего, кроме разнесения данных по определенным категориям.

Порядковая шкала

Данные получают числовую оценку, которая указывает на их иерархию, порядок следования, но о количественном значении признака говорит лишь очень условно.

Шкале ответов типа Только А - Чаще А –А и Б - Чаще Б - Только Б может быть сопоставлен числовой ряд 1 – 2 – 3 – 4 – 5, но это не означает, что различие в оценках 1 и 2 (Только А и Чаще А) в точности таково же, как и между оценками 3 и 4 (А и Б и Чаще Б).

Пример из [Бахтин 1984], шестибалльная шкала степени владения языком:

1 – свободно говорит на языке и предпочитает этот язык всем остальным;

2 – свободно говорит на языке, но предпочитает какой-либо другой язык;

3 – говорит на языке, однако старшие замечают в его речи ошибки;

4 – хорошо понимает речь, но сам способен произнести лишь десяток обиходных фраз;

5 – понимает общий смысл сказанного, говорить не может совершенно;

6 – не знает языка.

 

Интервальная шкала

Величины отражают равные единицы измерения и могут сопоставляться не только по упорядоченности, но и по расстоянию. Пример: измерение особенностей произношения в пределах возрастных групп, отражающих равные интервалы: 16-30 лет, 31-45, 46-60, 61-75…

Интервальные шкалы разделены на равные расстояния, но сама единица измерения обычно имеет условный характер и не существует вне процесса измерения.

 

Количественная шкала

Единица измерения получает четкую наглядную интерпретацию.

Такими шкалами измеряется, например, возраст или число испытуемых.

Социолингвистика широко пользуется этим типом измерения при описании подходящих характеристик населения.

Собственно социолингвистические переменные привязать к количественным шкалам затруднительно.

 

Корреляция в социолингвистике

Независимые и зависимые переменные. Пример: возраст – степень владения языком.

Корреляция как зависимость переменных.

Корреляция может быть положительной (переменные возрастают или убывают одновременно) или отрицательной, когда они изменяются в разных направлениях.

Пример: у эскимосов наблюдается положительная корреляция возраста с уровнем владения этническим языком (т. е. чем старше человек, тем выше его уровень владения этническим языком) и отрицательная – по владению русским: чем старше человек, тем ниже его уровень владения русским языком.

 

Корреляции могут проявляться и при номинальных измерениях. Примеры: уровень двуязычия часто коррелирует с полом (билингвов больше среди мужчин) или с родом занятий (билингвов больше среди торговцев, чем среди крестьян).

 

Ложные корреляции

Наличие корреляции не обязательно говорит о причинно-следственной связи: оба сопоставляемых показателя могут зависеть от третьего.

Пример: половые различия в знании и употреблении языков связаны не с физиологическими различиями полов, а с половыми стереотипами поведения, которые, по этнографическим данным, не обладают универсальностью.

 

Экстралингвистические факторы социолингвистических данных как источники возможных корреляций (в т. ч. ложных)

Социальная структура:

Структура общества (этнос как групповая общность; культура)

Индивид и его социальные статусы

Социальное неравенство, социальная стратификация

Демография:

Половозрастная структура

Численный состав населения, его естественное изменение

Территориальный и социальный состав населения

Миграции населения

 

Публикация социолингвистических статистических результатов

Взаимозависимость переменных представляется в табличном или графическом виде.

Форма подачи во многом зависит от того, кому адресована публикация. Если публикация рассчитана на массового читателя, предпочтение отдается наглядным диаграммам. Профессионала же интересуют более точные и детализированные сведения, которые легче получить при табличном представлении результатов.

Существенная часть социолингвистических исследований строится на сопоставлении ранее опубликованных результатов, а сама возможность сопоставления результатов, полученных разными авторами, зависит от степени сходства использовавшихся методик

Примеры социолингвистических выкладок

Гендерные исследования на материале корпуса

Гендерная характеристика длины высказывания [Даниэль, Зеленков, 2012]

Источник данных – устный подраздел в НКРЯ (10 млн текстоформ).

3 группы документов: публичная речь, непубличная речь, речь кино.

Метаразметка по признакам пола и возраста.

Средняя длина высказывания как социолингвистический показатель. Понятие «реплики» как набора высказываний до смены говорящего или до конца документа.

Стереотип женской речи: «болтливость».

Полученные данные

Средняя длина реплики

Мужчины: 26, 34 слова

Женщины: 15, 41 слова

Средняя длина реплики в публичной речи

Мужчины: 30, 36

Женщины: 20, 65

Средняя длина реплики в частной речи

Мужчины: 10, 77

Женщины: 10, 29

Полученные данные

Средняя длина реплик в зависимости от пола адресата

 

В частном разговоре женщина больше говорит с женщиной, а мужчина – с мужчиной. В публичной речи пол адресата значительно увеличивает продолжительность реплики у обоих полов.

 

 

Гендерные характеристики ряда семантических классов слов [Мухин, 2014]

Источник данных – основной подраздел в НКРЯ

 

На текущий момент в основной части корпуса

Мужских текстов: 32 806 документов,

15 071 686 предложений, 180 140 656 слов (180 млн).

Женских текстов: 10 511 документов,

2 566 969 предложений, 28 914 624 слова (29 млн).

Доля текстов с обозначенным полом автора:

86, 2 % 13, 8 %

Предыстория и уточнение терминов

Проблема междометий

Кто чаще ахает – женщины или мужчины? J

Если судить по зоне снятой грамматической омонимии, мужчины употребляют междометия в два раза чаще, чем женщины (1604 ↔ 891 на миллион слов, ipm ).

Определимся с понятиями:

гендер – статистические различия в приоритетах употребления слов мужчинами и женщинами, объясняемые социальными стереотипами;

антигендер – отсутствие таких различий;

трансгендер – выбор приоритетов употребления слов, стереотипно свойственных противоположному полу.

 

Гендерно маркированные группы слов и социальное ожидание (гипотеза):

Чувства, эмоции

Цвета, цветовая картина мира

Деньги

Спорт

Алкоголь, табак

Неприличные слова

Секс, сексуальность

 

Учитывается фактор омонимии при подборе материала

 

Чувства, эмоции

любовь

любить

любимый

ненависть

ненавидеть

радоваться

радость

радостный

грустить

грусть

грустный

счастье

счастливый

несчастье

несчастливый

горе

горевать

 

Цвета, цветовая картина мира

 

Цвета: значимые гендерные различия

Деньги

Спорт

Алкоголь, табак

Неприличные слова

Мат (три корня)

Секс, сексуальность

Статистика употребления слов с корнем секс-, ipm:

Основные итоги

положит. чувства, эмоции

цвета: частные различия

деньги (кроме рубля)

алкоголь (водка), курение

мат

 

отрицат. чувства, эмоции

цветовая картина мира

деньги (рубль)

 

междометия

спорт, кроме хоккея

коньяк, пиво, сигареты

грубое просторечие

секс, сексуальность (? )

Статистические методы при изучении языковой нормы:


Поделиться:



Последнее изменение этой страницы: 2017-04-12; Просмотров: 105; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.051 с.)
Главная | Случайная страница | Обратная связь