Автор Анна Евкова
Преподаватель который помогает студентам и школьникам в учёбе.

Линейный регрессионный анализ - определение и вычисление с примерами решения

Содержание:

Уравнение линейной регрессии:

Регрессия - это оценка зависимости одной случайной величины от другой случайной величины.

Уравнением регрессии Линейный регрессионный анализ - определение и вычисление с примерами решения

Линейный регрессионный анализ - определение и вычисление с примерами решения

Функцию Линейный регрессионный анализ - определение и вычисление с примерами решения называют модельной функцией регрессии Y на X, а ее график - модельной линией регрессии Y на X. Уравнение (12.1) называется уравне­нием регрессии 1-го рода. Функцией Линейный регрессионный анализ - определение и вычисление с примерами решения может представляться полином Линейный регрессионный анализ - определение и вычисление с примерами решения степени Линейный регрессионный анализ - определение и вычисление с примерами решения- коэффициенты уравнения регрессии.

Пусть заданы две генеральные случайные величины Х и Y и выборочные пары их значений:Линейный регрессионный анализ - определение и вычисление с примерами решения Если эти выборочные значения нанести на плоскость в декартовой системе координат X, У, то получим диаграмму в виде точек (диаграмму рассеивания), которая называется корреляци­онным полем.
 

Пример:

Пусть изучаем зависимость веса человека от его роста для определенной группы людей. Для этого, например, в группе студентов проводим измерения веса, пусть это будет случайная величина Линейный регрессионный анализ - определение и вычисление с примерами решения и роста - случайная величина X для каждого студента. Результаты занесли в таблицу в виде выборочных пар их значений:Линейный регрессионный анализ - определение и вычисление с примерами решения и нанесли на плоскость в системе коорди­нат X,Y. В результате получим корреляционное поле (рис. 12.1). Изобразим на рисунке предполагаемую теоретическую зависимость между У и Х в виде жирной линии - это и есть модельная линия регрессии У на X. Она, допустим, опи­сывается определенной аналитической зависимостью Линейный регрессионный анализ - определение и вычисление с примерами решения, т. е. модельной функцией регрессии У на X.

Линейный регрессионный анализ - определение и вычисление с примерами решения

Аппроксимируем корреляционное поле (см. на рис. 12.1) пунктирной линией - это будет эмпирическая линия регрессии, которая может описываться несколько другой аналитической зависимостью. Понятно, что вид эмпириче­ской линии регрессии (зависимость веса человека от его роста) зависит от многих факторов: возраста, национальности, пола и т. д. Сравнение модельной и эмпирической линий регрессии позволяет выявить справедливость наших теоретических предположений.

Рассмотрим линейную регрессию. Предположим, что между Х и Y существует линейная зависимость: Линейный регрессионный анализ - определение и вычисление с примерами решения Допустим, что при любом значении X мы можем измерить значение Y с некоторой ошибкой Линейный регрессионный анализ - определение и вычисление с примерами решения Тогда выборочное значение Линейный регрессионный анализ - определение и вычисление с примерами решения можно представить в следующем виде:

Линейный регрессионный анализ - определение и вычисление с примерами решения                                                  (12.2)

где Линейный регрессионный анализ - определение и вычисление с примерами решения - точная линейная зависимость,

Линейный регрессионный анализ - определение и вычисление с примерами решения - ошибка.

Будем предполагать, что Линейный регрессионный анализ - определение и вычисление с примерами решения величина ошибки, - это случайная величина с нормальным законом распределения с Линейный регрессионный анализ - определение и вычисление с примерами решения обозначим Линейный регрессионный анализ - определение и вычисление с примерами решения

Исходя из выборочных значений можно каким-либо методом найти точечные оценки коэффициентов Линейный регрессионный анализ - определение и вычисление с примерами решения уравнения регрессии (12.2).
 

Уравнение, в которое входят оценки Линейный регрессионный анализ - определение и вычисление с примерами решения коэффициентов уравне­ния регрессии Линейный регрессионный анализ - определение и вычисление с примерами решения и которое является приближенным выражением модельной функции регрессии Y на X, называется эмпирической функцией регрессии или уравнением регрессии 2-го рода: Линейный регрессионный анализ - определение и вычисление с примерами решения

Сформулируем суть регрессионного анализа.
 

Регрессионный анализ - это анализ функций регрессий первого и второго рода, состоящий в следующем:

  1. Нахождение точечных и интервальных оценок параметров функции регрессии 1-го рода.
  2. Осуществление точечного и интервального оценивания условных математических ожиданий, необходимого для предсказания средних значений одной случайной величины, соответствующих определенным фиксированным значениям другой случайной величины.
  3. Проверка согласованности найденной эмпирической функции регрессии с экспериментальными данными.

Для определения точечных оценок параметров функции регрессии чаще используется метод наименьших квадратов.

Метод наименьших квадратов

Метод наименьших квадратов (МНК) позволяет так выбрать параметры Линейный регрессионный анализ - определение и вычисление с примерами решения эмпирической функции регрессии, что она будет наилучшей оценкой модельной функции регрессии в том смысле, что сумма квадратов отклонений наблюдаемых значений переменной Y от соответствующих ординат эмпирической функции регрессии будет наименьшей.

Параметры Линейный регрессионный анализ - определение и вычисление с примерами решения эмпирической функции регрессии Линейный регрессионный анализ - определение и вычисление с примерами решения находятся методом наименьших квадратов из условия

Линейный регрессионный анализ - определение и вычисление с примерами решения                                   (12.3)
 

МНК обеспечивает наилучшее согласование теоретической зависимости Линейный регрессионный анализ - определение и вычисление с примерами решения и экспериментальных данных.

Подробнее рассмотрим применение МНК для определения точечных оценок параметров функции регрессии. В результате проведения п опытов получаем двумерную выборку Линейный регрессионный анализ - определение и вычисление с примерами решения Пусть эмпирическая функция регрессии линейна, т. е. Линейный регрессионный анализ - определение и вычисление с примерами решения (значок Линейный регрессионный анализ - определение и вычисление с примерами решения над коэффициентами Линейный регрессионный анализ - определение и вычисление с примерами решения опускаем для упрощения записи), тогда (12.3) принимает вид

Линейный регрессионный анализ - определение и вычисление с примерами решения                               (12.4)

Для определения минимума функции 5 необходимо найти производные по интересующим нас параметрам, приравнять их к нулю и решить полученные уравнения. Вычисляем частные производные и приравниваем их к нулю:
Линейный регрессионный анализ - определение и вычисление с примерами решения                                     (12.5)

Раскрываем знак суммы:

Линейный регрессионный анализ - определение и вычисление с примерами решения

Учтем, чтоЛинейный регрессионный анализ - определение и вычисление с примерами решения

Тогда из (12.6) получаем точечную оценку коэффициента Линейный регрессионный анализ - определение и вычисление с примерами решения

Линейный регрессионный анализ - определение и вычисление с примерами решения

Из второго уравнения (12.6) имеем

Линейный регрессионный анализ - определение и вычисление с примерами решения

После определения точечных оценок обычно проверяют предположение о виде эмпирической функции регрессии: линейная она или нелинейная. На практике условное математическое ожидание Линейный регрессионный анализ - определение и вычисление с примерами решения (или уравнение регрессии 1-го рода) часто считают линейной функцией, т. е. Линейный регрессионный анализ - определение и вычисление с примерами решения Это предположение является гипотезой, которая проверяется путем оценки коэф­фициента корреляции.
 

Корреляционный анализ - это анализ оценок коэффициента корреляции Линейный регрессионный анализ - определение и вычисление с примерами решения который позволяет ответить на вопрос, существует ли линейная функциональная зависимость между математическим ожида­нием случайной величины X и случайной величины У. Если ответ положительный, то метод корреляционного анализа позволяет измерить степень близости статистической зависимости (т. е. экспериментальных данных) к функциональ­ной.

Коэффициент корреляции (оценки)

При изучении курса теории вероятностей в разделе 4.2 мы определили ковариацию или корреляционный момент

Линейный регрессионный анализ - определение и вычисление с примерами решения

и коэффициент корреляции
Линейный регрессионный анализ - определение и вычисление с примерами решения

Для оценки связи между случайными величинами X и Y применяют то­чечные оценки Линейный регрессионный анализ - определение и вычисление с примерами решения которые называются эмпирическим корреляционным моментом и эмпирическим коэффициентом корреляции'.
Линейный регрессионный анализ - определение и вычисление с примерами решения

Линейный регрессионный анализ - определение и вычисление с примерами решения

Найдем связь между точечной оценкой коэффициента Линейный регрессионный анализ - определение и вычисление с примерами решения линейного урав­нения регрессии (12.2) и оценкой коэффициента корреляции Линейный регрессионный анализ - определение и вычисление с примерами решения

Преобразуем Линейный регрессионный анализ - определение и вычисление с примерами решения (12.11): 

Линейный регрессионный анализ - определение и вычисление с примерами решения

Рассмотрим оценку Линейный регрессионный анализ - определение и вычисление с примерами решения (12.8). Преобразуем выражение:
Линейный регрессионный анализ - определение и вычисление с примерами решения

Данное выражение определяется через выборочную дисперсию Линейный регрессионный анализ - определение и вычисление с примерами решения

Линейный регрессионный анализ - определение и вычисление с примерами решения

Тогда оценка Линейный регрессионный анализ - определение и вычисление с примерами решения (12.8) определится через Линейный регрессионный анализ - определение и вычисление с примерами решения так:

Линейный регрессионный анализ - определение и вычисление с примерами решения

где Линейный регрессионный анализ - определение и вычисление с примерами решения - выборочные дисперсии
Уравнение линейной регрессии (12.2) будет иметь вид

Линейный регрессионный анализ - определение и вычисление с примерами решения

Влияние значений коэффициента корреляции Линейный регрессионный анализ - определение и вычисление с примерами решения на функциональную зависимость между Линейный регрессионный анализ - определение и вычисление с примерами решенияиллюстрирует рис. 12.2.

Линейный регрессионный анализ - определение и вычисление с примерами решения

Чем ближе по модулю коэффициент корреляции к единице, тем точнее линейная зависимость между случайными величинами X и У, (тем ближе к ли­нии регрессии располагаются точки на диаграмме рассеивания). Чем ближе Линейный регрессионный анализ - определение и вычисление с примерами решения к нулю, тем слабее эта зависимость. Говорят, что при Линейный регрессионный анализ - определение и вычисление с примерами решения (см. рис. 12.2, а, в) между Х и Y существует положительная корреляция. При Линейный регрессионный анализ - определение и вычисление с примерами решения (см. рис. 12.2, б) между У и Y существует отрицательная корреляция. При Линейный регрессионный анализ - определение и вычисление с примерами решения (см. рис. 12.2, г) Х и Y некоррелированны.

Поскольку коэффициент корреляции Линейный регрессионный анализ - определение и вычисление с примерами решения характеризует степень линейной зависимости, то при Линейный регрессионный анализ - определение и вычисление с примерами решения может оказаться, что между X и Y существует нелинейная связь.

Построение доверительных интервалов для коэффициентов уравнения регрессии

Доверительные интервалы для коэффициентов уравнения регрессии по­зволяют для заданной доверительной вероятности Линейный регрессионный анализ - определение и вычисление с примерами решения выяснить, насколько сильно могут отклоняться коэффициенты эмпирической функции регрессии от соответствующих коэффициентов модельной функции регрессии. Это позволит оценить точность определения коэффициентов уравнения регрессии, корректировать объемы выборки для проведения теоретических исследований.
В разделе 12.2 были определены точечные оценки коэффициентов уравнения регрессии по выборочным данным:

Линейный регрессионный анализ - определение и вычисление с примерами решения

Вычислим дисперсии точечных оценок Линейный регрессионный анализ - определение и вычисление с примерами решения т. е. определим рассеивание случайной величины Y относительно линии регрессии Линейный регрессионный анализ - определение и вычисление с примерами решения Ранее мы положили (см. раздел 12.1), что Линейный регрессионный анализ - определение и вычисление с примерами решения - величина ошибки, которая распределена по нормальному закону Линейный регрессионный анализ - определение и вычисление с примерами решения Полагая, что дисперсия Y постоянная и не зависит от X, можно Линейный регрессионный анализ - определение и вычисление с примерами решения рассматривать в последующих преобразованиях как постоянную величину. Тогда

Линейный регрессионный анализ - определение и вычисление с примерами решения

Линейный регрессионный анализ - определение и вычисление с примерами решения

Заменяя дисперсию Линейный регрессионный анализ - определение и вычисление с примерами решения на оценку Линейный регрессионный анализ - определение и вычисление с примерами решения , определяемую как Линейный регрессионный анализ - определение и вычисление с примерами решения , можно показать, что величина Линейный регрессионный анализ - определение и вычисление с примерами решения имеет закон распределения Линейный регрессионный анализ - определение и вычисление с примерами решения степенями свободы.
Для получения доверительного интервала для коэффициента Линейный регрессионный анализ - определение и вычисление с примерами решения возьмем разность между точечной оценкой Линейный регрессионный анализ - определение и вычисление с примерами решения и коэффициентом Линейный регрессионный анализ - определение и вычисление с примерами решения Нормируем ее, разделим на Линейный регрессионный анализ - определение и вычисление с примерами решения и обозначим как Линейный регрессионный анализ - определение и вычисление с примерами решения

Линейный регрессионный анализ - определение и вычисление с примерами решения

Аналогично для коэффициента Линейный регрессионный анализ - определение и вычисление с примерами решения

Линейный регрессионный анализ - определение и вычисление с примерами решения

Подставляя в (12.19), (12.20) выражения (12.17), (12.18) и разделив (12.19), (12.20) на Линейный регрессионный анализ - определение и вычисление с примерами решения, получим

Линейный регрессионный анализ - определение и вычисление с примерами решения

Эти случайные величины имеют закон распределения Стьюдента с Линейный регрессионный анализ - определение и вычисление с примерами решения степенями свободы.

Зная закон распределения случайной величины V (плотность распределения Линейный регрессионный анализ - определение и вычисление с примерами решениязакона распределения Стьюдента), можно найти вероятность ее попадания в интервал Линейный регрессионный анализ - определение и вычисление с примерами решения

Линейный регрессионный анализ - определение и вычисление с примерами решения

Из условия (12.22) для заданной доверительной вероятности Линейный регрессионный анализ - определение и вычисление с примерами решения и числа степеней свободы Линейный регрессионный анализ - определение и вычисление с примерами решения по таблицам распределения Стьюдента находим квантили Линейный регрессионный анализ - определение и вычисление с примерами решения. Считая Линейный регрессионный анализ - определение и вычисление с примерами решения известными и подставляя вместо Линейный регрессионный анализ - определение и вычисление с примерами решения выражения (12.21) в правую часть выражения (12.22), получим неравенство

Линейный регрессионный анализ - определение и вычисление с примерами решения

Решая неравенство относительно Линейный регрессионный анализ - определение и вычисление с примерами решения находим доверительный интервал для коэффициента Линейный регрессионный анализ - определение и вычисление с примерами решения:

Линейный регрессионный анализ - определение и вычисление с примерами решения                                        (12.23)
Аналогично поступим для случайной величины W , записывая условие

Линейный регрессионный анализ - определение и вычисление с примерами решения                                      (12.24)

Определяя квантили Линейный регрессионный анализ - определение и вычисление с примерами решения по таблицам распределения Стьюдента, решаем неравенство в правой части (12.24):

Линейный регрессионный анализ - определение и вычисление с примерами решения                                  (12.25)
Из (12.25) получаем доверительный интервал для коэффициента Линейный регрессионный анализ - определение и вычисление с примерами решения

Линейный регрессионный анализ - определение и вычисление с примерами решения