domvpavlino.ru

Ермолаев математическая статистика для психологов скачать doc. Основы математической статистики для психологов

Математическая статистика - Наука о том, как систематизировать и использовать статистические данные для научных и прикладных целей.

Математическая статистика в психологии

В психологии как науке математическая статистика применяется очень широко. С помощью тех или иных способов, например тестирования, разным особенностям поведения человека сопоставляются числа (шкалируются), и с этими числами уже работают методами математической статистики. После применения этих методов получаются новые данные, которые следует осмыслить.

Без применения математической статистики психология была бы довольно плоской и малоинформативной наукой, основанной на домыслах и спекуляциях (как это, например, имеет место быть в психоанализе). Разумеется, использование математической статистики не является "противоядием" против домыслов и спекуляций, однако предмет рассуждений становится значительно богаче.

Рассмотрим типичный и простой случай использования математической статистики. Допустим, кто-то провел исследование группы школьников. В числе прочих были найдены такие параметры, как экстраверсия-интроверсия и уровень интеллекта. Психолога-исследователя заинтересовало, а как связаны эти параметры между собой. Правда ли, что интроверты в среднем умнее экстравертов? Для этого группу испытуемых (выборку) можно поделить на две подгруппы: экстравертов и интровертов. Далее по каждой подгруппе находится среднее арифметическое по уровню интеллекта. Если, скажем, у интровертов в среднем IQ выше, значит, они умнее экстравертов. Это один подход. Другой может состоять в том, чтобы разделить испытуемых на подгруппу с высоким IQ (более 100) и низким (менее 100), а потом посчитать среднее по экстраверсии-интроверсии в каждой группе. Третий подход может состоять в том, чтобы вместо деления на подгруппы и высчитывания в них средних задействовать более сложный метод – корреляционный анализ. Все эти три методы по-разному, но покажут одну и ту же связь.

Математическая статистика позволяет делать интересные, иногда удивительные открытия. Продолжим наш гипотетический пример. Предположим, что психолог нашел парадоксальный результат, который противоречит с его прошлым опытом, знаниями. Скажем, он установил, что в одной школе экстраверты умнее интровертов, хотя во всех других школах было наоборот. Почему так? Дотошный психолог может начать свое расследование и установит, что, к примеру, это связано с тем, что в этой школе экстраверты ходят на факультатив по физике (потому что там «заводной учитель») и развивают свой интеллект, а интроверты ходят на факультатив по литературе (потому что там «душевный учитель»), где развивают другие качества своей души. Может ли, например, психоаналитик дойти до такого открытия? Крайне маловероятно.

В психологических исследованиях в расчет берутся не только такие чисто психологические параметры, как, скажем, интеллект, экстравертированность или тревожность. Могут использоваться и такие данные, как возраст, пол, уровень образования, рост, вес, физическая сила, политические взгляды, стаж работы и многое другое. Часто бывает, что именно без таких непсихологических показателей исследования оказываются неполными, малоинформативными. Также часто бывает, что представители других наук (например, социологии или биологии) тоже используют психологические параметры в своих исследованиях.

Математическая статистика позволяет много вещей:

Практические психологи в своей работе обычно ограничиваются нахождением средней арифметической, с разделением на подгруппы (как в примере выше). Ученые-психологи используют самый разнообразный арсенал методов математической статистики. Рассмотрим основные.

Нахождение средней арифметической

Самый банальный и простой метод. Показатели (например, рост испытуемых) складываются, затем делятся на число испытуемых. Несмотря на простоту, метод, конечно, очень информативный и наглядный. Наглядность – важное качество метода для практического психолога. Когда он представляет результаты своих исследований заказчику (например, директору школы), тот далеко не всегда способен понять сущность корреляционного или дисперсионного анализа. Разделение испытуемых на подгруппы по произвольному основанию усиливает потенциал средней арифметической, позволяя закрыть большинство потребностей исследователя.

Нахождение моды и медианы

Предположим, мы обследовали 1000 студентов – измеряли их рост с точностью до сантиметра. Эти данные заносили в таблицу. Если в таблице чаще всего встречается значение, скажем, 172 сантиметра, это и есть мода нашей выборки. Аналогичным, кстати, образом слово "мода" используется и в быту: если в этом сезоне чаще всего можно встретить шапочки красного цвета, значит это мода, хотя на долю этих шапочек может приходиться всего лишь 20 или 30 процентов.

В психологических исследованиях обычно мода находится где-то рядом со средней арифметической. Если мода 172 см, то и средняя будет около того. Чем больше выборка, тем ближе мода и среднее арифметическое.

Далее. Предположим, мы поделили своих студентов на две равные группы: в первой группе 500 низких студентов, во второй группе 500 высоких студентов. Значение роста, которое приходится на 500-го или 501-го студента и есть медиана . Медиана обычно тоже находится рядом со средней арифметической.

Выявление рассеяния значений

Как известно, средняя температура по больнице не так уж важна. И в хорошей больнице, где лечат хорошо, средняя температура может быть 36,6°C; и в плохой может быть такая же: просто у кого-то жар в 40 °C, а кто-то уже умер, и у него 18°C.

Самый простой способ оценить рассеяние выборки – найти ее размах (иначе – разброс). Если в нашей выборке самый низкий студент имеет рост 148 см, а самый высокий 205 см, значит размах выборки составит 205-148=57 см. Это величина важна в первую очередь для того, чтобы оценить, в каких рамках вообще меняется данный параметр.

Далее. Предположим такую ситуацию. Лет через двадцать по прихоти какого-нибудь богатого человека у него появятся дети-клоны. Ещё через двадцать лет они поступят в университет. И будет в университете выборка студентов объемом 1000 человек, из которых 998 имеют рост 177 см, один – 148 см, один – 205 см. По основным параметрам – средней арифметической, моде, медиане, размаху – эта выборка может не отличаться от другой выборки студентов (там будут такие же значения). Но при этом во второй (нормальной) выборке будет какое-то количество студентов с ростом 150-160 см, какое-то с ростом 180-190 см и т.д. Так что же, получается, что с точки зрения математической статистики эти группы одинаковые?

Одного взгляда на этот рисунок достаточно, чтобы понять, что группы различаются по рассеянию значений. Поэтому в статистике есть более точный инструмент для оценки рассеивания – дисперсия . Дисперсию исчисляют так: находят среднее арифметическое, потом для каждого случая находят отклонение от среднего, возводят это значение в квадрат, в конце делят на общее количество случаев. Из значения дисперсии легко получить стандартное отклонение : оно есть квадратный корень из дисперсии. Стандартное отклонение обозначает, что понятно, стандартное отклонение: то есть мера того, насколько в среднем значения вообще отклоняются.

Стандартное отклонение измеряется в тех же самых единицах, что и сам параметр. В первой нашей гипотетической группе, где почти все студенты одинаковы, стандартное отклонение будет крайне малым (менее 1 см). Во второй группе будет значительно больше – сантиметров 10-15. Если нам скажут, что средний рост студентов составляет 175 см при стандартном отклонении 12 см, мы будем знать, что большинство студентов (примерно 2/3) находится в диапазоне от 163 до 187 см.

t-критерий Стьюдента

Предположим, мы решили провести эксперимент такого рода. Мы взяли группу испытуемых. Перед началом эксперимента протестировали их, скажем, на уровень креативности. Далее они целый месяц занимались по часу в день рисованием. В конце эксперимента мы опять проверили их на уровень креативности. Был замечен результат, но довольно малый, и скептики стали нам заявлять, что уровень креативности не повысился, небольшое повышение средней арифметической это всего лишь случайность.

Для таких ситуаций придумали разные критерии. Один из них – наиболее популярный – это t-критерий Стьюдента. В числителе у него разница средних арифметических. В знаменателе – корень из суммы квадратов дисперсий (имеется в виду первый и второй случай тестирования). Чем больше разница между средними арифметическими, тем лучше (наш труд не остался напрасным), и чем меньше разброс значений в обоих случаях диагностики, тем тоже лучше: когда разброс значений больше, тогда и случайные колебания тоже больше.

Для применения данного критерия есть существенное ограничение – распределение показателей должно быть близко к так называемому нормальному (колоколообразному).

Существуют специальные критерии для определения степени нормальности распределения.

Корреляция

В психологии, как наверное ни в одной другой науке, любят находить коэффициенты корреляции. Существует несколько разных подходов, в том числе и для нормального, и для не нормального распределения. Все они показывают степень зависимости одного параметра от другого. Если один параметр (например, вес человека) сильно зависит от другого параметра (например, рост человека), тогда коэффициент корреляции будет близок к +1. Если зависимость обратная (например, чем человек выше, тем менее ловок он), тогда коэффициент корреляции будет стремиться к -1. Если зависимости нет (скажем, удачливость при игре в карты не зависит от роста человека), тогда коэффициент корреляции будет около 0.

Если взять группу испытуемых, зафиксировать их рост и вес, а потом результаты перенести на двухмерный график, то получится примерно следующая картина, которая свидетельствует о том, что корреляция положительная, примерно на уровне +0.5.

Факторный анализ

Наиболее, пожалуй, таинственный анализ. Некоторая загадочность его объясняется тем, что сам он предназначен для того, чтобы найти новый параметр, который многое объясняет, но при этом непосредственно в ходе эксперимента не исследовался. Как правило, в ходе факторного анализа находятся наиболее влиятельные параметры, от которых зависят более мелкие, частные.

Допустим, мы проводили исследование со школьниками. В числе прочих фиксировались следующие параметры: общая успеваемость, успеваемость по точным предметам, успеваемость по гуманитарным предметам, объем кратковременной памяти, объем и распределение внимания, активность мышления, пространственное воображение, общая осведомленность, общительность, тревожность. Если применить корреляционный анализ и составить так называемую матрицу корреляций (где отражена связь каждого параметра с каждым), то можно увидеть, что большинство этих параметров между собой хорошо коррелирует. Исключение составляет последние два, которые с другими связаны слабо. Уже глядя на эту матрицу можно предположить, что за большинством параметров стоит некий один общий (сверх-параметр), который на них на всех влияет. Мы проводим процедуру факторного анализа, и после этого в нашей матрице появляется еще один столбец – столбец без названия. Этот загадочный параметр очень хорошо коррелирует со всеми (кроме общительности и тревожности). После некоторого творческого раздумья психолог приходит к единственно возможной здесь интерпретации – загадочный параметр это есть интеллект. Он и влияет на все остальное, влияние его сильное, хотя и не стопроцентное.

Существуют методы факторного анализа, которые помогают выявить не один, а несколько факторов, которые влияют на другие параметры. Часто так бывает, конечно, что загадочный параметр оказывается не таким уж и загадочным, а полностью совпадает с одним из тех параметров, которые фиксировались. Но иногда бывает и так, что придется долго поломать голову прежде, чем удастся интерпретировать этот секретный фактор.

Факторный анализ применяется в основном учеными для глубокого понимания предмета исследования. При этом следует учитывать, что для точности результата необходимо довольно большое количество испытуемых: желательно, чтобы количество испытуемых в разы превышало количество параметров.

С помощью факторного анализа можно изучать качество психологических тестов. Если взять, например, какой-нибудь личностный опросник с несколькими параметрами, подвергнуть эти параметры факторному анализу, то может всплыть некий странный общий фактор, влияющий на все параметры. Значимого психологического смысла он может не иметь – это просто тенденция испытуемого отвечать так или иначе по формальному признаку (кто-то отвечает вдумчиво, кто-то склонен выбирать первые пункты из вариантов, кто-то последние). Большое влияние этого общего фактора может говорить о недостаточно качественной проработке заданий.

Литература

Ермолаев О. Ю. Математическая статистика для психологов: Учебник. - 2-е изд. испр. - М.: МПСИ, Флинта, 2003. - 336 с.

Глава 1. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ СОБЫТИЙ
1.1. СОБЫТИЕ И МЕРЫ ВОЗМОЖНОСТИ ЕГО ПОЯВЛЕНИЯ
1.1.1. Понятие о событии
1.1.2. Случайные и неслучайные события
1.1.3. Частота частость и вероятность
1.1.4. Статистическое определение вероятности
1.1.5. Геометрическое определение вероятности
1.2. СИСТЕМА СЛУЧАЙНЫХ СОБЫТИЙ
1.2.1. Понятие о системе событий
1.2.2. Совместное появление событий
1.2.3. Зависимость между событиями
1.2.4. Преобразования событий
1.2.5. Уровни количественного определения событий
1.3. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СИСТЕМЫ КЛАССИФИЦИРОВАННЫХ СОБЫТИЙ
1.3.1. Распределения вероятностей событий
1.3.2. Ранжирование событий в системе по вероятностям
1.3.3. Меры связи между классифицированными событиями
1.3.4. Последовательности событий
1.4. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СИСТЕМЫ УПОРЯДОЧЕННЫХ СОБЫТИЙ
1.4.1. Ранжирование событий по величине
1.4.2. Распределение вероятностей ранжированной системы упорядоченных событий
1.4.3. Количественные характеристики распределения вероятностей системы упорядоченных событий
1.4.4. Меры корреляции рангов
Глава 2. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
2.1. СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ РАСПРЕДЕЛЕНИЕ
2.1.1. Случайная величина
2.1.2. Распределение вероятностей значений случайной величины
2.1.3. Основные свойства распределений
2.2. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЯ
2.2.1. Меры положения
2.2.2. Меры асимметрии и эксцесса
2.3. ОПРЕДЕЛЕНИЕ ЧИСЛОВЫХ ХАРАКТЕРИСТИК ПО ЭКСПЕРИМЕНТАЛЬНЫМ ДАННЫМ
2.3.1. Исходные положения
2.3.2. Вычисление мер положения рассеивания асимметрии и эксцесса по несгруппированным данным
2.3.3. Группировка данных и получение эмпирических распределений
2.3.4. Вычисление мер положения рассеивания асимметрии и эксцесса по эмпирическому распределению
2.4. ВИДЫ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
2.4.1. Общие положения
2.4.2. Нормальный закон
2.4.3. Нормализация распределений
2.4.4. Некоторые другие законы распределения важные для психологии
Глава 3. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ ДВУМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН
3.1. РАСПРЕДЕЛЕНИЯ В СИСТЕМЕ ИЗ ДВУХ СЛУЧАЙНЫХ ВЕЛИЧИН
3.1.1. Система из двух случайных величин
3.1.2. Совместное распределение двух случайных величин
3.1.3. Частные безусловные и условные эмпирические распределения и взаимосвязь случайных величин в двумерной системе
3.2. ХАРАКТЕРИСТИКИ ПОЛОЖЕНИЯ РАССЕИВАНИЯ И СВЯЗИ
3.2.1. Числовые характеристики положения и рассеивания
3.2.2. Простые регрессии
3.2.3. Меры корреляции
3.2.4. Совокупные характеристики положения рассеивания и связи
3.3. ОПРЕДЕЛЕНИЕ КОЛИЧЕСТВЕННЫХ ХАРАКТЕРИСТИК ДВУМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН ПО ДАННЫМ ЭКСПЕРИМЕНТА
3.3.1. Аппроксимация простой регрессии
3.3.2. Определение числовых характеристик при небольшом количестве экспериментальных данных
3.3.3. Полный расчет количественных характеристик двумерной системы
3.3.4. Расчет совокупных характеристик двумерной системы
Глава 4. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ МНОГОМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН
4.1. МНОГОМЕРНЫЕ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН И ИХ ХАРАКТЕРИСТИКИ
4.1.1. Понятие о многомерной системе
4.1.2. Разновидности многомерных систем
4.1.3. Распределения в многомерной системе
4.1.4. Числовые характеристики в многомерной системе
4.2. НЕСЛУЧАЙНЫЕ ФУНКЦИИ ОТ СЛУЧАЙНЫХ АРГУМЕНТОВ
4.2.1. Числовые характеристики суммы и произведения случайных величин
4.2.2. Законы распределения линейной функции от случайных аргументов
4.2.3. Множественные линейные регрессии
4.3. ОПРЕДЕЛЕНИЕ ЧИСЛОВЫХ ХАРАКТЕРИСТИК МНОГОМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН ПО ДАННЫМ ЭКСПЕРИМЕНТА
4.3.1. Оценка вероятностей многомерного распределения
4.3.2. Определение множественных регрессий и связанных с ними числовых характеристик
4.4. СЛУЧАЙНЫЕ ФУНКЦИИ
4.4.1. Свойства и количественные характеристики случайных функций
4.4.2. Некоторые классы случайных функций важные для психологии
4.4.3. Определение характеристик случайной функции из эксперимента
Глава 5. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ
5.1. ЗАДАЧИ СТАТИСТИЧЕСКОЙ ПРОВЕРКИ ГИПОТЕЗ
5.1.1. Генеральная совокупность и выборка
5.1.2. Количественные характеристики генеральной совокупности и выборки
5.1.3. Погрешности статистических оценок
5.1.4. Задачи статистической проверки гипотез в психологических исследованиях
5.2. СТАТИСТИЧЕСКИЕ КРИТЕРИИ ОЦЕНИВАНИЯ И ПРОВЕРКИ ГИПОТЕЗ
5.2.1. Понятие о статистических критериях
5.2.2. х-критерий Пирсона
5.2.3. Основные параметрические критерии
5.3. ОСНОВНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ПРОВЕРКИ ГИПОТЕЗ
5.3.1. Метод максимального правдоподобия
5.3.2. Метод Бейеса
5.3.3. Классический метод определения параметра функции с заданной точностью
5.3.4. Метод проектирования репрезентативной выборки по модели совокупности
5.3.5. Метод последовательной проверки статистических гипотез
Глава 6. ОСНОВЫ ДИСПЕРСИОННОГО АНАЛИЗА И МАТЕМАТИЧЕСКОГО ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА
6.1. ПОНЯТИЕ О ДИСПЕРСИОННОМ АНАЛИЗЕ
6.1.1. Сущность дисперсионного анализа
6.1.2. Предпосылки дисперсионного анализа
6.1.3. Задачи дисперсионного анализа
6.1.4. Виды дисперсионного анализа
6.2. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
6.2.1. Схема расчета при одинаковом количестве повторных испытаний
6.2.2. Схема расчета при разном количестве повторных испытаний
6.3. ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
6.3.1. Схема расчета при отсутствии повторных испытаний
6.3.2. Схема расчета при наличии повторных испытаний
6.4. Трехфакторный дисперсионный анализ
6.5. ОСНОВЫ МАТЕМАТИЧЕСКОГО ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА
6.5.1. Понятие о математическом планировании эксперимента
6.5.2. Построение полного ортогонального плана эксперимента
6.5.3. Обработка результатов математически спланированного эксперимента
Глава 7. ОСНОВЫ ФАКТОРНОГО АНАЛИЗА
7.1. ПОНЯТИЕ О ФАКТОРНОМ АНАЛИЗЕ
7.1.1. Сущность факторного анализа
7.1.2. Разновидности методов факторного анализа
7.1.3. Задачи факторного анализа в психологии
7.2. ОДНОФАКТОРНЫЙ АНАЛИЗ
7.3. МУЛЬТИФАКТОРНЫЙ АНАЛИЗ
7.3.1. Геометрическая интерпретация корреляционной и факторной матриц
7.3.2. Центроидный метод факторизации
7.3.3. Простая латентная структура и ротация
7.3.4. Пример мультифакторного анализа с ортогональной ротацией
Приложение 1. ПОЛЕЗНЫЕ СВЕДЕНИЯ О МАТРИЦАХ И ДЕЙСТВИЯХ С НИМИ
Приложение 2. МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА

Слово «статистика» часто ассоциируется со словом «математика», и это пугает студентов, связывающих это понятие со сложными формулами, требующими высокого уровня абстрагирования.

Однако, как говорит Мак-Коннелл, статистика - это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статистикой. Хотим ли мы спланировать бюджет, рассчитать потребление бензина автомашиной, оценить усилия, которые потребуются для усвоения какого-то курса, с учетом полученных до сих пор отметок, предусмотреть вероятность хорошей и плохой погоды по метеорологической сводке или вообще оценить, как повлияет то или иное событие на наше личное или совместное будущее, — нам постоянно приходится отбирать, классифицировать и упорядочивать информацию, связывать ее с другими данными так, чтобы можно было сделать выводы, позволяющие принять верное решение.

Все эти виды деятельности мало отличаются от тех операций, которые лежат в основе научного исследования и состоят в синтезе данных, полученных на различных группах объектов в том или ином эксперименте, в их сравнении с целью выяснить черты различия между ними, в их сопоставлении с целью выявить показатели, изменяющиеся в одном направлении, и, наконец, в предсказании определенных фактов на основании тех выводов, к которым приводят полученные результаты. Именно в этом заключается цель статистики в науках вообще, особенно в гуманитарных. В последних нет ничего абсолютно достоверного, и без статистики выводы в большинстве случаев были бы чисто интуитивными и не могли бы составлять солидную основу для интерпретации данных, полученных в других исследованиях.

Для того чтобы оценить огромные преимущества, которые может дать статистика, мы попробуем проследить за ходом расшифровки и обработки данных, полученных в эксперименте. Тем самым, исходя из конкретных результатов и тех вопросов, которые они ставят перед исследователем, мы сможем разобраться в различных методиках и несложных способах их применения. Однако, перед тем как приступить к этой работе, нам будет полезно рассмотреть в самых общих чертах три главных раздела статистики.

1. Описательная статистика , как следует из названия, позволяет описывать, подытоживать и воспроизводить в виде таблиц или графиков

данные того или иного распределения , вычислять среднее для данного распределения и его размах и дисперсию .

2. Задача индуктивной статистики - проверка того, можно ли распространить результаты, полученные на данной выборке , на всю популяцию , из которой взята эта выборка. Иными словами, правила этого раздела статистики позволяют выяснить, до какой степени можно путем индукции обобщить на большее число объектов ту или иную закономерность, обнаруженную при изучении их ограниченной группы в ходе какого-либо наблюдения или эксперимента. Таким образом, при помощи индуктивной статистики делают какие-то выводы и обобщения, исходя из данных, полученных при изучении выборки.

3. Наконец, измерение корреляции позволяет узнать, насколько связаны между собой две переменные, с тем чтобы можно было предсказывать возможные значения одной из них, если мы знаем другую.

Существуют две разновидности статистических методов или тестов, позволяющих делать обобщение или вычислять степень корреляции. Первая разновидность - это наиболее широко применяемые параметрические методы , в которых используются такие параметры, как среднее значение или дисперсия данных. Вторая разновидность - это непараметрические методы , оказывающие неоценимую услугу в том случае, когда исследователь имеет дело с очень малыми выборками или с качественными данными; эти методы очень просты с точки зрения как расчетов, так и применения. Когда мы познакомимся с различными способами описания данных и перейдем к их статистическому анализу, мы рассмотрим обе эти разновидности.

Как уже говорилось, для того чтобы попытаться разобраться в этих различных областях статистики, мы попробуем ответить на те вопросы, которые возникают в связи с результатами того или иного исследования. В качестве примера мы возьмем один эксперимент, а именно - изучение влияния потребления марихуаны на глазодвигательную координацию и на время реакции. Методика, используемая в этом гипотетическом эксперименте, а также результаты, которые мы могли бы в нем получить, представлены ниже.

При желании вы можете заменить какие-то конкретные детали этого эксперимента на другие - например, потребление марихуаны на потребление алкоголя или лишение сна, - или, что еще лучше, подставить вместо этих гипотетических данных те, которые вы действительно получили в вашем собственном исследовании. В любом случае вам придется принять «правила нашей игры» и выполнять те расчеты, которые здесь от вас потребуются; только при этом условии до вас «дойдет» существо предмета, если это уже не случилось с вами раньше.

Важное примечание. В разделах, посвященных описательной и индуктивной статистике, мы будем рассматривать только те данные эксперимента, которые имеют отношение к зависимой переменной «поражаемые мишени». Что касается такого показателя, как время реакции, то мы обратимся к нему только в разделе о вычислении корреляции. Однако само собой разумеется, что уже с самого начала значения этого показателя надо обрабатывать так же, как и переменную «поражаемые мишени». Мы предоставляем читателю заняться этим самостоятельно с помощью карандаша и бумаги.

Некоторые основные понятия. Популяция и выборка

Одна из задач статистики состоит в том, чтобы анализировать данные, полученные на части популяции, с целью сделать выводы относительно популяции в целом.

Популяция в статистике не обязательно означает какую-либо группу людей или естественное сообщество; этот термин относится ко всем существам или предметам, образующим общую изучаемую совокупность, будь то атомы или студенты, посещающие то или иное кафе.

Выборка - этонебольшое количество элементов, отобранных с помощью научных методов так, чтобы она была репрезентативной, т.е. отражала популяцию в целом.

отечественной литературе более распространены термины соответственно «генеральная совокупность» и «выборочная совокупность». - Прим. перев. )

Данные и их разновидности

Данные в статистике - это основные элементы, подлежащие анализу. Данными могут быть какие-то количественные результаты, свойства, присущие определенным членам популяции, место в той или иной последовательности - в общем любая информация, которая может быть классифицирована или разбита на категории с целью обработки.

Не следует смешивать «данные» с теми «значениями», которые эти данные могут принимать. Для того чтобы всегда различать их, Шатийон (Chatillon, 1977) рекомендует запомнить следующую фразу: «Данные часто принимают одни и те же значения» (так, если мы возьмем, например, шесть данных - 8, 13, 10, 8, 10 и 5, то они принимают лишь четыре разных значения - 5, 8, 10 и 13).

Построение распределения - это разделение первичных данных, полученных на выборке, на классы или категории с целью получить обобщенную упорядоченную картину, позволяющую их анализировать.

Существуют три типа данных:

1. Количественные данные , получаемые при измерениях (например, данные о весе, размерах, температуре, времени, результатах тестирования и т. п.). Их можно распределить по шкале с равными интервалами.

2. Порядковые данные , соответствующие местам этих элементов в последовательности, полученной при их расположении в возрастающем порядке (1-й, ..., 7-й, ..., 100-й, ...; А, Б, В. ...).

3. Качественные данные , представляющие собой какие-то свойства элементов выборки или популяции. Их нельзя измерить, и единственной их количественной оценкой служит частота встречаемости (число лиц с голубыми или с зелеными глазами, курильщиков и не курильщиков, утомленных и отдохнувших, сильных и слабых и т.п.).

Из всех этих типов данных только количественные данные можно анализировать с помощью методов, в основе которых лежат параметры (такие, например, как средняя арифметическая). Но даже к количественным данным такие методы можно применить лишь в том случае, если число этих данных достаточно, чтобы проявилось нормальное распределение. Итак, для использования параметрических методов в принципе необходимы три условия: данные должны быть количественными, их число должно быть достаточным, а их распределение - нормальным. Во всех остальных случаях всегда рекомендуется использовать непараметрические методы.

Многомерные статистические методы среди множества возможных вероятностно-статистических моделей позволяют обоснованно выбрать ту, которая наилучшим образом соответствует исходным статистическим данным, характеризующим реальное поведение исследуемой совокупности объектов, оценить надежность и точность выводов, сделанных на основании ограниченного статистического материала. В пособии рассмотрены следующие методы многомерного статистического анализа: регрессионный анализ, факторный анализ, дискриминантный анализ. Излагается структура пакета прикладных программ «Statistica», а также реализация в данном пакете изложенных методов многомерного статистического анализа.

Год выпуска : 2007
Автор : Буреева Н.Н.
Жанр : Учебное пособие
Издательство : Нижний Новгород

Метки ,

В учебном пособии рассматриваются возможности использования пакета прикладных программ (ППП) STATISTICA для реализации статистических методов анализа эмпирических распределений и проведения выборочного статистического наблюдения в объеме, достаточном для решения широкого круга практических задач. Рекомендуется студентам факультета экономики и менеджмента дневного и вечернего отделений, изучающих дисциплину «Статистика». Пособие может быть использовано студентами — дипломниками, аспирантами, научными и практическими работниками, столкнувшимися с необходимостью использования статистических методов обработки исходных данных. Пособие содержит сведения по ППП STATISTICA, не публиковавшиеся на русском языке.

Год выпуска : 2009
Автор : Куприенко Н.В., Пономарева О.А., Тихонов Д.В.
Жанр : Пособие
Издательство : СПб.: Изд-во Политехн. ун-та

Метки ,

Книга является первым шагом к знакомству с программой STATISTICA для статистического анализа данных в среде Windows STATISTICA (фирма-производитель StatSoft Inc, USA) занимает устойчиво лидирующее положение среди программ статистической обработки данных, имеет более 250 тысяч зарегистрированных пользователей в мире.

На простых, доступных каждому примерах (описательная статистика, регрессия, дискриминантный анализ и др.), взятых из различных сфер жизни, показаны возможности системы по обработке данных. В приложении даны краткие материалы по панели инструментов, языку STATISTICA BASIC и др. Книга адресована самому широкому кругу читателей, работающих на персональных компьютерах, и доступна школьникам старших классов.

Метки ,

Фирменное руководство к программе STATISTICA 6. Очень большое и подробное. Полезно как справочник. Можно использовать как учебник. При серьезной работе с программой STATISTICA руководство нужно иметь.
Том I: Основные соглашения и статистики I
Том II: Графика
Том III: Статистики II
Подробности в файле с оглавлением.

Метки ,

Руководство содержит полное описание системы STATISTICA®.
Руководство состоит из пяти томов:
Том I: СОГЛАШЕНИЯ И СТАТИСТИКИ I
Том II: ГРАФИКА
Том III: СТАТИСТИКИ II
Том IV: ПРОМЫШЛЕННЫЕ СТАТИСТИКИ
Том V: ЯЗЫКИ: BASIC и SCL
В раздаче представлены три первых тома.

Метки ,

Изложены нейросетевые методы анализа данных, основанные на использовании пакета Statistica Neural Networks (фирма производитель StatSoft), полностью адаптированного для русского пользователя. Даны основы теории нейронных сетей; большое внимание уделено решению практических задач, всесторонне рассмотрена методология и технология проведения исследований с помощью пакета Statistica Neural Networks — мощного инструмента анализа и прогнозирования данных, имеющего широкие применения в бизнесе, промышленности, управлении, финансах. Книга содержит множество примеров анализа данных, практические рекомендации по проведению анализа, прогнозирования, классификации, распознавания образов, управления производственными процессами с помощью нейронных сетей.

Для широкого круга читателей, занимающихся исследованиями в банковской сфере, промышленности, экономике, бизнесе, геологоразведке, управлении, транспорте и других областях.

Метки ,

Книга посвящена теории и практике изучения основ математической статистики и педагогическим проблемам, возникающим в процессе обучения. Обещан опыт применения информационных технологий в изучении данной дисциплины.

Издание может быть полезно студентам, аспирантам и преподавателям медицинских колледжей и вузов.

Метки ,

В книге освещены наиболее важные элементы теории вероятностей, основные понятия математической статистики, некоторые разделы планирования экспериментов и прикладного статистического анализа в среде шестой версии программы Statistica. Большое количество примеров способствует более эффективному восприятию материала, развитию и приобретению навыков работы с ППП Statistica.
Издание обладает практической значимостью, поскольку необходимо для поддержки учебного процесса и научно-исследовательских работ в вузе на уровне, соответствующем современным информационным технологиям, обеспечивает более полное и эффективное усвоение студентами знаний в области прикладного статистического анализа данных, что способствует повышению качества образовательного процесса в высшей школе.

Адресуется студентам, аспирантам, научным работникам, преподавателям медицинских вузов, биологических факультетов. Будет полезна и интересна представителям других естественнонаучных и технических специальностей.

Метки ,

В данном учебном пособии описана русская версия программы STATISTICA.

Помимо общих принципов работы в системе и оценивания статистических характеристик показателей в пособии подробно рассмотрены этапы проведения корреляционного, регрессионного и дисперсионного анализов, многомерных классификаций. Описание сопровождается пошаговыми инструкциями и наглядными примерами, что делает изложенный материал доступным и для недостаточно подготовленных пользователей.

Учебное пособие предназначено для студентов, аспирантов и научных работников, интересующихся, статистическими компьютерными исследованиями.

Метки ,

Содержит описание практических методов и приемов прогнозирования в системе STATISTICA в среде Windows и изложение теоретических основ, дополненное разнообразными практическими примерами. Во втором издании (1-е изд. — 1999 г.) существенно переработана часть 1. Заново созданы и описаны все диалоговые окна, которые относятся к прогнозированию в современной версии STATISTICA 6.0, показана автоматизация решений с помощью языка STATISTICA Visual Basic. В части 2 изложены основы статистической теории прогнозирования.

Для студентов, аналитиков, маркетологов, экономистов, актуариев, финансистов, научных работников, использующих методы прогнозирования в повседневной деятельности.

Метки ,

Книга является учебно-методическим пособием по теории вероятностей, статистическим методам и исследованию операций. Приведены необходимые теоретические сведения и подробно рассматривается решение задач прикладной статистики с использованием пакета Statistica. Излагаются основы симплекс-метода и рассматривается решение задач исследования операций средствами пакета Excel. Приводятся варианты заданий и методические разработки по основным разделам статистики и исследования операций.

Книга адресуется всем, кому необходимо применять статистические методы в своей деятельности, преподавателям и студентам, изучающим статистику и методы исследования операций.

Загрузка...