Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Ковариация в теории вероятности - определение и вычисление с примерами решения

Содержание:

Ковариация:

Важную информацию о системе случайных величин Ковариация в теории вероятности - определение и вычисление с примерами решения

Ковариация в теории вероятности - определение и вычисление с примерами решения

которая называется ковариацией или ковариационным моментом. Заметим, чтоКовариация в теории вероятности - определение и вычисление с примерами решения Из определения ковариации следует, что Ковариация в теории вероятности - определение и вычисление с примерами решения

откуда 

Ковариация в теории вероятности - определение и вычисление с примерами решения

Кроме того, Ковариация в теории вероятности - определение и вычисление с примерами решения

Если случайные величины X и Y независимы, то их ковариация равна нулю и тогда

Ковариация в теории вероятности - определение и вычисление с примерами решения

Ковариация содержит информацию о зависимости между величинами. Но значение Ковариация в теории вероятности - определение и вычисление с примерами решения изменяется при изменении единиц измерения X и Y. Поэтому для характеристики зависимости между величинами удобно рассматривать величину

Ковариация в теории вероятности - определение и вычисление с примерами решения

которая называется коэффициентом корреляции величин X и Y.

Величины Ковариация в теории вероятности - определение и вычисление с примерами решения и Ковариация в теории вероятности - определение и вычисление с примерами решения характеризуют разброс положений случайной точка на плоскости. Эти числовые характеристики принято записывать в виде матрицыКовариация в теории вероятности - определение и вычисление с примерами решения

которую называют ковариационной матрицей системы случайных величин (X,Y).

Корреляционная зависимость

Наиболее простой и известной формой зависимости между величинами является функциональная зависимость, при которой каждому значению аргумента соответствует строго определенное значение функции. Функциональная зависимость может быть и между случайными величинами. Существует иной, широко распространенный в природе, тип зависимости между случайными величинами. Эта зависимость проявляется в том, что закон распределения одной случайной величины изменяется при изменении другой. Такая зависимость называется статистической.

Следует заметить, что функциональная зависимость бывает лишь в теоретических построениях или в условиях специально подготовленных опытов. Физический опыт в том и состоит, что исследователь старается по возможности исключить влияние всех посторонних факторов и наблюдать зависимость в чистом виде.

Явления окружающего нас мира взаимосвязаны и воздействие одной переменной на другую происходит при одновременном воздействии множества других переменных, поэтому даже функциональные зависимости проявляются как зависимости статистические.

Итак, при статистической зависимости изменение одной величины приводит к изменению закона распределения другой. Если Y – дискретная случайная величина, то это означает, что при каждом фиксированном значении Ковариация в теории вероятности - определение и вычисление с примерами решения имеется набор возможных значений Ковариация в теории вероятности - определение и вычисление с примерами решения и соответствующих им вероятностей Ковариация в теории вероятности - определение и вычисление с примерами решения Последним обозначением подчеркивается, что речь идет о событии Ковариация в теории вероятности - определение и вычисление с примерами решения при условии, что произошло событие Ковариация в теории вероятности - определение и вычисление с примерами решения.

Набор возможных значений Ковариация в теории вероятности - определение и вычисление с примерами решения и соответствующих им условных вероятностей образует условный закон распределения Ковариация в теории вероятности - определение и вычисление с примерами решения

Для непрерывной случайной величины можно ввести понятие условной функции распределения или условной плотности вероятности. Если рассмотреть вероятности событий Ковариация в теории вероятности - определение и вычисление с примерами решения и Ковариация в теории вероятности - определение и вычисление с примерами решения то по аналогии с теоремой умножения вероятностей событий можно получить для условной плотности вероятности Ковариация в теории вероятности - определение и вычисление с примерами решения соотношение Ковариация в теории вероятности - определение и вычисление с примерами решения где Ковариация в теории вероятности - определение и вычисление с примерами решения– плотность вероятности системы Ковариация в теории вероятности - определение и вычисление с примерами решения а Ковариация в теории вероятности - определение и вычисление с примерами решения– маргинальная плотность вероятности случайной величины X. Из этого соотношенияКовариация в теории вероятности - определение и вычисление с примерами решения

На протяжении этого раздела будем проводить выкладки только для дискретных случайных величин. Для непрерывных случайных величин все рассуждения и выводы останутся в силе, если заменить суммы на интегралы, а вероятности на плотности вероятности.

Статистическая зависимость сложна для изучения. Трудно проследить за изменением всего закона распределения сразу. Проще сосредоточиться на изучении изменения числовых характеристик, в первую очередь математического ожидания. Условный закон распределения имеет числовые характеристики такие же, как и обычные законы распределения. В частности, Ковариация в теории вероятности - определение и вычисление с примерами решения– для дискретной случайной величины называют условным математическим ожиданием, или средним значением Y при заданном значении Ковариация в теории вероятности - определение и вычисление с примерами решения. Для непрерывной случайной величины его вычисляют в виде Ковариация в теории вероятности - определение и вычисление с примерами решения Если условные математические ожидания при разных значениях X соединить, то получится линия, называемая линией регрессии Y на X. Уравнение этой линии называют уравнением регрессии Y на X (см. рис. 2.14.1, на котором точками показаны возможные значения двумерной случайной величины Ковариация в теории вероятности - определение и вычисление с примерами решения).

Ковариация в теории вероятности - определение и вычисление с примерами решения

Корреляционной зависимостью Y от X называется функциональная зависимость условного среднего значения Y от X. Графиком корреляционной зависимости служит линия регрессии. Например, рост человека X и его вес Y связаны статистической зависимостью. Для каждого значения роста существует целое распределение возможных значений веса. Между этими величинами существует и корреляционная зависимость, которая для людей зрелого возраста выражается известной формулой:

Ковариация в теории вероятности - определение и вычисление с примерами решения

Вместе с изменением условного среднего значения может изменяться и разброс Y относительно условного среднего значения. При каждом 142 значении Ковариация в теории вероятности - определение и вычисление с примерами решения можно вычислить дисперсию соответствующих значений Y. Эту дисперсию называют условной дисперсией. Например, для дискретной случайной величины условная дисперсия равна Ковариация в теории вероятности - определение и вычисление с примерами решения

Всякую зависимость изучают для того, чтобы уметь по известному значению одной величины предсказывать значение другой. При статистической зависимости между величинами можно использовать для прогноза линию регрессии. Если стало известно, что Ковариация в теории вероятности - определение и вычисление с примерами решения, то в качестве предполагаемого значения Y можно назвать соответствующее условное среднее значение Ковариация в теории вероятности - определение и вычисление с примерами решения т.е. ординату линии регрессии при данном Ковариация в теории вероятности - определение и вычисление с примерами решения Если Y принимает значение Ковариация в теории вероятности - определение и вычисление с примерами решения то Ковариация в теории вероятности - определение и вычисление с примерами решения будет ошибкой прогноза и величину Ковариация в теории вероятности - определение и вычисление с примерами решения можно рассматривать как среднюю квадратическую ошибку прогноза Y по значению X при указанном способе действий.

Представление о среднем квадрате ошибки прогноза Y по линии регрессии дает средняя из условных дисперсий

Ковариация в теории вероятности - определение и вычисление с примерами решения

Здесь значения Ковариация в теории вероятности - определение и вычисление с примерами решения взяты с учетом вероятности каждого значения Ковариация в теории вероятности - определение и вычисление с примерами решения Величина Ковариация в теории вероятности - определение и вычисление с примерами решения равна среднему квадрату отклонения значений Y от линии регрессии. Ее можно записать в виде Ковариация в теории вероятности - определение и вычисление с примерами решения

Заметим, что при прогнозе Y по любой другой линии средний квадрат ошибки прогноза будет больше. В самом деле, для любой постоянной Ковариация в теории вероятности - определение и вычисление с примерами решенияКовариация в теории вероятности - определение и вычисление с примерами решения

Второе слагаемое в правой части равно нулю, так как Ковариация в теории вероятности - определение и вычисление с примерами решения Ковариация в теории вероятности - определение и вычисление с примерами решенияТретье слагаемое, очевидно, неотрицательно. Поэтому Ковариация в теории вероятности - определение и вычисление с примерами решения

Равенство возможно лишь при Ковариация в теории вероятности - определение и вычисление с примерами решения Это означает, что средняя квадратическая ошибка прогноза будет наименьшей, если случайную величину прогнозировать по ее среднему значению. Линия регрессии проходит через условные средние значения Y. Поэтому можно утверждать, что линия регрессии минимизирует среднюю квадратическую ошибку прогноза случайной величины Y по наблюдаемому значению величины X.

Линейная корреляция

Корреляция называется линейной, если линия регрессии одной величины на другую является прямой. В противном случае говорят о нелинейной корреляции.

Пусть линия регрессии имеет вид Ковариация в теории вероятности - определение и вычисление с примерами решения Согласно свойству линии регрессии, должен быть минимален средний квадрат отклонений Y от этой линии, т.е. минимальной должна быть величинаКовариация в теории вероятности - определение и вычисление с примерами решения

причем ее минимальное значение равно Ковариация в теории вероятности - определение и вычисление с примерами решения

Параметры Ковариация в теории вероятности - определение и вычисление с примерами решения можно найти из условия минимума функции Ковариация в теории вероятности - определение и вычисление с примерами решенияНеобходимые условия экстремума дают систему уравненийКовариация в теории вероятности - определение и вычисление с примерами решения

решения которой имеют вид Ковариация в теории вероятности - определение и вычисление с примерами решения

где Ковариация в теории вероятности - определение и вычисление с примерами решения– коэффициент корреляции (2.14.1). Если выражения (2.14.3) подставить в Ковариация в теории вероятности - определение и вычисление с примерами решения то после ряда преобразований получается, чтоКовариация в теории вероятности - определение и вычисление с примерами решения

Из соотношений (2.14.3) и (2.14.4) можно извлечь информацию о свойствах коэффициента корреляции.

1. Так как Ковариация в теории вероятности - определение и вычисление с примерами решения то Ковариация в теории вероятности - определение и вычисление с примерами решения откуда Ковариация в теории вероятности - определение и вычисление с примерами решения

2. ЕслиКовариация в теории вероятности - определение и вычисление с примерами решения то в силу (2.14.3) и угловой коэффициент линии регрессии равен нулю. Линия регрессии параллельна оси ОX. В этом случае говорят, что величины некоррелированы, так как среднее значение Y не изменяется при изменении X. Отсутствие корреляционной зависимости не всегда означает независимость величин. Например, при постоянном среднем значении Y может изменяться разброс значений относительно среднего (см. рис. 2.14.2, на котором точками изображены возможные положения случайной точки).

3. Из (2.14.3) следует, что угловой коэффициент линии регрессии Ковариация в теории вероятности - определение и вычисление с примерами решения и коэффициент корреляции имеют одинаковые знаки. Если Ковариация в теории вероятности - определение и вычисление с примерами решения то говорят, что величины коррелированы положительно. В этом случае большему значению величины X соответствует большее среднее значение Y (см. рис. 2.14.3). Еще раз подчеркнем, что речь идет именно об увеличении среднего значения Y. В отдельных опытах большему X может соответствовать меньшее Y. Например, положительно коррелированы рост и вес человека, возраст и высота дерева, качество сырья и качество продукции и т.д.

Ковариация в теории вероятности - определение и вычисление с примерами решения

Если Ковариация в теории вероятности - определение и вычисление с примерами решения то говорят, что величины коррелированы отрицательно. Это означает, что большему значению одной величины соответствует в среднем меньшее значение другой. Например, число пропусков занятий и успеваемость коррелированы отрицательно.

4. Если Ковариация в теории вероятности - определение и вычисление с примерами решения то из (2.14.4) следует, что Ковариация в теории вероятности - определение и вычисление с примерами решения В этом случае разброса относительно линии регрессии нет. Между величинами существует линейная функциональная зависимость.

5. Из (2.14.4) следует, что Ковариация в теории вероятности - определение и вычисление с примерами решения при Ковариация в теории вероятности - определение и вычисление с примерами решения  Значит, чем больше по модулю коэффициент корреляции, тем теснее прилегают значения Y к линии регрессии, тем меньше средний квадрат ошибки прогноза Y по наблюдаемому значению X. На рис. 2.14.4 для сравнения показан разброс положений случайной точки Ковариация в теории вероятности - определение и вычисление с примерами решения относительно линии регрессии при двух разных значениях коэффициента корреляции Ковариация в теории вероятности - определение и вычисление с примерами решения

Ковариация в теории вероятности - определение и вычисление с примерами решения

Коэффициент корреляции служит мерой линейной зависимости между величинами. Он показывает насколько статистическая зависимость близка к функциональной.

Отметим, что в силу (2.14.3) уравнение линии регрессии можно записать в видеКовариация в теории вероятности - определение и вычисление с примерами решения

или 

Ковариация в теории вероятности - определение и вычисление с примерами решения

Пример №1

Случайные величины X и Y независимы и имеют одинаковое распределение с математическим ожиданием Ковариация в теории вероятности - определение и вычисление с примерами решения и дисперсией Ковариация в теории вероятности - определение и вычисление с примерами решения

1) Найти коэффициент корреляции случайных величин  Ковариация в теории вероятности - определение и вычисление с примерами решения и Ковариация в теории вероятности - определение и вычисление с примерами решения

2) Найти коэффициент корреляции между случайными величинами Ковариация в теории вероятности - определение и вычисление с примерами решения

Решение. 1) По определению Ковариация в теории вероятности - определение и вычисление с примерами решения Найдем необходимые для вычисления Ковариация в теории вероятности - определение и вычисление с примерами решения величины. По свойствам математического ожидания и дисперсии имеем:

Ковариация в теории вероятности - определение и вычисление с примерами решения

Аналогично, Ковариация в теории вероятности - определение и вычисление с примерами решения

Ковариация в теории вероятности - определение и вычисление с примерами решения

Так как X и Y независимы, то Ковариация в теории вероятности - определение и вычисление с примерами решения

В результате имеем

Ковариация в теории вероятности - определение и вычисление с примерами решения

2) Вычислим величины, которые необходимы для использования формулыКовариация в теории вероятности - определение и вычисление с примерами решения

Так как X и Y независимы, то Ковариация в теории вероятности - определение и вычисление с примерами решения

Поэтому Ковариация в теории вероятности - определение и вычисление с примерами решения

Ответ.  Ковариация в теории вероятности - определение и вычисление с примерами решения

Пример №2

Равновозможны все положения случайной точки Ковариация в теории вероятности - определение и вычисление с примерами решения в треугольнике D с вершинами А(0,0), В(0,1) и С(2,1). Найти коэффициент корреляции случайных величин X и Y. Найти линию регрессии Y на X и оценить точность прогноза величины Y по наблюдаемому значению X.

Решение. Равновозможность всех положений случайной точки Ковариация в теории вероятности - определение и вычисление с примерами решения в треугольнике АВС (см. рис. 2.14.5) означает, что плотность вероятности Ковариация в теории вероятности - определение и вычисление с примерами решения вне этого треугольника, а в точках треугольника постоянна.

Площадь треугольника АВС равна 1. В точках треугольника положим Ковариация в теории вероятности - определение и вычисление с примерами решения Тем самым соблюдено условие равенства единице объема, заключенного между функцией плотности вероятности и координатной плоскостью (напомним, что это является одним из отличительных свойств функции плотности вероятности системы двух случайных величин).Ковариация в теории вероятности - определение и вычисление с примерами решения

Маргинальные функции плотности вероятности величин X и Y равны соответственно: 

Ковариация в теории вероятности - определение и вычисление с примерами решения

Вычислим величины, необходимые для использования формул (2.14.3) и (2.14.5): Ковариация в теории вероятности - определение и вычисление с примерами решения

Тогда Ковариация в теории вероятности - определение и вычисление с примерами решения

Ковариация в теории вероятности - определение и вычисление с примерами решения

По формулам (2.14.3), (2.14.5) находим коэффициент корреляции Ковариация в теории вероятности - определение и вычисление с примерами решения и уравнение линии регрессии Ковариация в теории вероятности - определение и вычисление с примерами решения Если использовать эту линию регрессии для прогноза Y по известному значению X, то средний квадрат ошибки прогноза по формуле (2.14.4) равен Ковариация в теории вероятности - определение и вычисление с примерами решения

Ответ. Ковариация в теории вероятности - определение и вычисление с примерами решения

Пример №3

Подбрасывают два игральных кубика. Пусть X – число выпавших «пятерок», а Y – число нечетных очков. Найдите закон 149 распределения случайного вектора Ковариация в теории вероятности - определение и вычисление с примерами решения его математическое ожидание и дисперсионную матрицу. Найдите коэффициент корреляции Ковариация в теории вероятности - определение и вычисление с примерами решения

Решение. Если кубики однородны и симметричны, то вероятность выпадения каждой грани равна 1/6. Запишем сначала закон распределения случайного вектора Ковариация в теории вероятности - определение и вычисление с примерами решения. Каждая из компонент вектора может принимать только значения 0, 1 и 2. Поэтому закон распределения можно представить в виде таблицы: Ковариация в теории вероятности - определение и вычисление с примерами решения

В клетках таблицы записаны вероятности Ковариация в теории вероятности - определение и вычисление с примерами решения Например, 1Ковариация в теории вероятности - определение и вычисление с примерами решения так как с вероятностью Ковариация в теории вероятности - определение и вычисление с примерами решения на первом кубике появится «5», а на втором кубике с вероятностью Ковариация в теории вероятности - определение и вычисление с примерами решения выпадет четное число, либо наоборот, на первом кубике – четное число, а на втором – «5». Или, например, Ковариация в теории вероятности - определение и вычисление с примерами решения так как на каждом кубике должна выпасть нечетная цифра, но не «5». Вычислим числовые характеристики случайного вектора: 

Ковариация в теории вероятности - определение и вычисление с примерами решения

Заметим, что X имеет биномиальное распределение. Поэтому математическое ожидание можно было подсчитать проще: Ковариация в теории вероятности - определение и вычисление с примерами решения– произведение числа опытов на вероятность появления события в одном опыте. Аналогично,Ковариация в теории вероятности - определение и вычисление с примерами решения Для вычисления дисперсий вычислим предварительно математические ожидания квадратов величин:Ковариация в теории вероятности - определение и вычисление с примерами решения

Тогда Ковариация в теории вероятности - определение и вычисление с примерами решенияКовариация в теории вероятности - определение и вычисление с примерами решения

Дисперсионная матрица случайного вектора имеет вид Ковариация в теории вероятности - определение и вычисление с примерами решения

Коэффициент корреляции равен

Ковариация в теории вероятности - определение и вычисление с примерами решения

Ответ. Ковариация в теории вероятности - определение и вычисление с примерами решения

Замечание. Рассмотрим индикатор события A:Ковариация в теории вероятности - определение и вычисление с примерами решения

Известно, что Ковариация в теории вероятности - определение и вычисление с примерами решения Силу зависимости между событиями A и B можно оценить по величине коэффициента корреляции индикаторов этих событий. По формуле (2.14.1) имеемКовариация в теории вероятности - определение и вычисление с примерами решения

Коэффициент Ковариация в теории вероятности - определение и вычисление с примерами решения принимает значения в [-1;1], но есть некоторые особенности в трактовке значений коэффициента.

Если Ковариация в теории вероятности - определение и вычисление с примерами решения то события независимы и наоборот (вспомните, для случайных величин факт равенства коэффициента корреляции нулю не означал независимость случайных величин). Положительные значения коэффициента корреляции говорят о том, что появление одного события увеличивает вероятность появления другого. Например, из рис. 2.14.6 видно, что отношение площади области B к площади прямоугольника меньше, чем отношение площади области AB к площади области A. Поэтому факт появления события A увеличивает вероятность появления события B.Ковариация в теории вероятности - определение и вычисление с примерами решения

Чем ближе к плюс единице значение Ковариация в теории вероятности - определение и вычисление с примерами решения, тем в большей степени проявляется это увеличение. При Ковариация в теории вероятности - определение и вычисление с примерами решения появление одного события всегда влечет появление другого. Если же Ковариация в теории вероятности - определение и вычисление с примерами решения то появление одного события уменьшает вероятность появления другого. Например, из рис. 2.14.7 видно, что отношение площади области B к площади прямоугольника больше, чем отношение площади области AB к площади области A. Поэтому факт появления события A уменьшает вероятность появления события B. ЗначениеКовариация в теории вероятности - определение и вычисление с примерами решения свидетельствует о том, что появление одного события исключает появление другого. Ковариация в теории вероятности - определение и вычисление с примерами решения

Пример №4

В одной урне четыре белых и два черных шара, а во второй два белых и три черных. Обозначим через A и B выбор белого шара соответственно из первой и второй урны. Ясно, что Ковариация в теории вероятности - определение и вычисление с примерами решения а 152 P( ) 2 / 5 B = и события независимы. Пусть при выборе из первой урны белого шара, его перекладывают во вторую урну и только потом выбирают из нее шар. Оценить силу зависимости между событиями A и B.

Решение. Для вычисления коэффициента корреляции воспользуемся формулой (2.14.6):

Ковариация в теории вероятности - определение и вычисление с примерами решения

Заметим, что в случае добавлении не одного, а двух белых шаров во вторую урну этот коэффициент равен

 Ковариация в теории вероятности - определение и вычисление с примерами решения

Ответ. Ковариация в теории вероятности - определение и вычисление с примерами решения