Пространство R" - определение и примеры решения
Содержание:
Последовательное n-кратное выполнение операции декартова произведения множества действительных чисел R на само себя формирует множество R" элементов, представляющих собой упорядоченные наборы n чисел
Точки можно складывать и умножать на число.
Расстоянием между точками x и у принято называть число
При n = 2 и n = 3 - это обычное расстояние между точками на плоскости или в пространстве.
Расстояние обладает следующими свойствами:
С помощью понятия расстояния р можно определить понятие сферы радиуса R с центром в точке , как множество точек, каждая из которых находится на расстоянии R от точки .
Шаром с радиусом R и центром в точке называется множество точек () удаленных от точки на расстояние не превосходящее R:
Множество называется ограниченным, если оно целиком содержится в некотором шаре. Нетрудно показать, что ограниченность множества {М} означает, что существует такое число R> 0, что величины координат любой точки из {М} по абсолютной величине не превосходит R.
Пусть число > О сколь угодно мало, тогда множество точек , координаты которых удовлетворяют неравенству < , называются - окрестностью точки т.е. для всех точек М из - окрестности точки расстояние .
Далее, используя понятие -окрестности, можно ввести классификацию точек области D.
Точка называется предельной или точкой сгущения области D, если в любой -окрестности точки найдутся точки множества D, отличные отточки .
Точка называется внутренней точкой множества D, если она входит в D вместе с некоторой окрестностью. Любая внутренняя точка является предельной точкой множества, однако обратное утверждение не верно. Например, множество рациональных чисел Q составлено только из предельных точек, но ни одна из них не является внутренней точкой.
Точка называется внешней точкой множества D, если в D не входит ни сама точка ни точки ее -окрестности.
Точка называется граничной точкой множества D, если любая ее - окрестность содержит как точки, принадлежащие множеству D, так и не принадлежащие ему.
Точка называется изолированной точкой множества D, если она принадлежит D, но имеет некоторую окрестность, в которой отсутствуют точки этого множества, отличные от . Изолированными точками являются, например, целые числа.
Множество, составленное из одних внутренних точек, называется открытой областью. Множество, которое содержит все свои предельные точки, называется замкнутым. Множество, которое не содержит изолированных точек, называется совершенным.
Выполнение простейших операций над множествами, таких как объединение и пересечение, позволяет сформулировать следующие общие свойства множеств:
- Любое объединение бесконечного числа открытых множеств является открытым множеством;
- Любое пересечение бесконечного числа замкнутых множеств является замкнутым множеством;
- Всякое конечное объединение замкнутых множеств является замкнутым множеством;
- Всякое конечное пересечение открытых множеств является открытым множеством.
Примечания:
- Бесконечное объединение замкнутых множеств может оказаться незамкнутым множеством;
- Бесконечное пересечение открытых множеств может оказаться неоткрытым множеством.
Последовательности в R" и сходимость
Аналогично последовательности чисел, можно определить последовательность точек Рассмотрим последовательность точек пространства :
Говорят, что эта последовательность сходится к точке , если величина расстояния между точками и есть величина бесконечно малая и с ростом k стремится к нулю:
Можно дать и другое определение сходящейся последовательности.
Пусть: - последовательность точек в . Эта последовательность сходится к точке , если последовательность сходится к последовательность сходится к
Так же, как и в случае числовой последовательности, любая - окрестность точки сгущения последовательности точек в содержит бесконечное число элементов последовательности.
Понятие последовательности точек в предполагает наличие биективного отображения между элементами множества и множеством натуральных чисел N. Если выделить последовательность из множества N у то соответствующие элементы образуют подпоследовательность последовательности (). Другими словами, подпоследовательность - это любая бесконечная часть последовательности.
Всякая ограниченная последовательность точек в пространстве содержит подпоследовательность, сходящуюся к некоторой точке из . Таким образом, если последовательность точек () ограничена, т.е. заключена внутри некоторого шара, то ввиду бесконечности этой последовательности, внутри этого шара обязательно должны найтись места сгущения этой последовательности (должны существовать подпоследовательности, сходящиеся к некоторым внутренним или граничным точкам этого шара).
Функции в R". Предел. Теорема Гейне
Если из области по определенному правилу или закону ставится в соответствие единственное значение величины , то говорят, что на области определена функция y = f(M). Координаты точки называются независимыми переменными или аргументами функции, переменная у- зависимой переменной, а символ f обозначает закон соответствия.
Описание законов соответствия y = f(M) в многомерном случае имеют намного более ограниченные возможности, нежели в одномерном случае. К основным способам задания функции нескольких переменных можно отнести:
- Формульный или аналитический;
- Структурно-логический;
- Геометрический.
Геометрический способ задания функции затруднен уже при n = 2, поскольку, в этом случае, график функциональной зависимости совпадает с поверхностью вида z = f(x,y), построенной в трехмерном пространстве.
Для того чтобы лучше представить себе характер изменения графика при различных значениях аргументов х и у в пространстве, задают плоские сечения поверхности плоскостями, соответствующими фиксированным значениям функции у-const. Получающиеся в каждом сечении кривые называют линиями уровня.
Уже при наглядность в задании функциональной зависимости исчезает, и все представления такого рода относятся к рассмотрению гиперповерхностных форм.
Определение предела функции по Коши:
Пусть дана функция у = f(M), определенная на области . Число С называется пределом у = f(M) в точке сгущения если такое, что
Символически обозначение предела выглядит следующим образом:
Определение предела функцин по Гейне:
При любом выборе последовательности точек , сходящейся к точке сгущения соответствующие числовые последовательности значений функции сходятся, причем у всех последовательностей должен быть единый предел.
Непрерывность функции в R"
Рассмотрим функцию у = f(M), определенную в области . Предположим, что лишь одна переменная получила приращение а остальные переменные остались неизменными. Тогда разность:
называется частным приращением функции по переменной . Функция называется непрерывной по переменной если функция определена как в точке так и в точке и эти точки являются точками сгущения этой функции. При этом должно выполняться условие т.е. бесконечно малым приращениям переменной должны соответствовать бесконечно малые частные приращения функции .
Если приращение получают все переменные, то соответствующее приращение функции: называется полным приращением функции (или просто приращением функции).
Естественно, что во всех точках, соответствующих как частным приращениям, так и полному приращению функции, сама функция должна быть определена.
Также следует отметить, что полное приращение функции, вообще говоря, не равно сумме частных приращений:
Функция многих переменных, определенная в D, называется непрерывной в точке сгущения , если:
Из данного определения следует, что:
- функция должна быть определена в точке и эта точка должна быть предельной в области существования функции;
- приращение = f(M)- f() для любой непрерывной функции является величиной бесконечно малой: причем это условие должно выполняться и для всех частных приращений функции f
Таким образом, для выполнения требования непрерывности функции нескольких переменных в точке необходимо, чтобы функция была непрерывна как в самой точке, так и в некоторой окрестности этой точки, причем при достаточно малых по абсолютной величине приращениях переменных
Непрерывность на множестве
Функция у — f(M) называется непрерывной на множестве D, если она непрерывна во всех точках этого множества.
Непрерывные функции многих переменных обладают следующими свойствами:
Композиции h(M) функций f(M) и g(M) вида:
- h(M) = f(M) + g(M).
- h(M) = f(M)-g(M).
- h(M) = f(M)-g(M).
- являются непрерывными в точке M , если f(M) и g(M) непрерывными в точке М .
По аналогии с понятием сложной функции одной переменной для функций нескольких переменных можно ввести понятие суперпозиции функций.
Если функция определена в области а семейство функций определено в и области изменения функций этого семейства содержатся во множестве А то в В задана сложная зависимость . Если функция определена в области А и непрерывна в а функции определены в В и непрерывны в , то при условии, что функция является непрерывной в точке , то есть
Теоремы о непрерывности
Теоремы Больцано-Коши и Вейерштраccа о непрерывности могут быть сформулированы и для функций многих переменных, однако в этом случае они имеют свою специфику, обусловленную более сложной природой множеств, на которых заданы функции, а также природой самих функциональных объектов.
Предварительно желательно ввести следующие геометрические истолкования функциональных объектов в :
- у = f(M) определенная на области может рассматриваться как гиперповерхность в n+ 1-мерном пространстве переменных ;
- - гиперкривая, которая задается как суперпозиция функции и параметрических зависимостей .
Если области изменения функций семейства . содержатся во множестве D, то график гиперкривой целиком располагается на гиперповерхности у = f(M).
Первая теорема Больцано-Коши. Пусть функция у = f(M) определена и непрерывна в замкнутой и связной области . Если в двух точках области выполняется условие , то на гиперкривой, соединяющей существует точка такая, что .
Вторая теорема Больцано-Коши. Пусть функция у = f(M) определена и непрерывна в замкнутой и связной области . Если в двух точках области выполняется условие то удовлетворяющего условию существует точка такая у что f{M') = С. Т.е. на каждом отрезке функция принимает все свои промежуточные значения.
Теоремы Больцано-Коши требуют соблюдения условий связности области . При этом сама область может быть неограниченной, в то время как теоремы Вейерштрасса требуют, чтобы область была ограниченной, но не требуют обязательности выполнения условия связности.
Первая теорема Вейерштрасса. Если функция у = f(M) определена и непрерывна в ограниченной и замкнутой области , то она ограничена в этой области.
Вторая теорема Вейерштрасса. Если функция у = f(M) определена и непрерывна в ограниченной и замкнутой области , то она имеет минимум и максимум в этой области.
Таким образом, математический инструментарий, отработанный на элементарном и наглядном объекте - функциях одной переменной, легко переносится на объекты более сложной природы - функции многих переменных.
Дифференцируемость функций в R". Частные производные
Если у функции нескольких переменных зафиксировать (т.е. приравнять постоянной величине) все переменные, кроме одной, то тогда эту функцию можно рассматривать как функцию этой переменной. Рассмотрим отношение частного приращения функции по переменной :
к приращению аргумента : . Предел этого приращения при , если таковой существует, называется частной производной первого порядка функции f по переменной .
Определение: Частной производной функции нескольких неременных но одной из неременных называется предел отношения соответствующего частного приращения функции к приращению рассматриваемой независимой переменной при условии у что последняя стремится к нулю:
Частная производная от функции многих переменных равна производной той функции одной переменной, которая получится, если все независимые переменные данной функции, кроме соответствующей одной, считать постоянными. Следовательно, частное дифференцирование не требует никаких новых правил дифференцирования, и можно пользоваться известными формулами дифференцирования функции одной переменной. Поскольку геометрическую трактовку имеют только функции двух переменных, то геометрический смысл частной производной можно установить на примере пространства . В этом случае функция z = f(z,y) задает в пространстве поверхность.
Условие х = задает плоскость, перпендикулярную оси Ох и пересекающую ее в точке . Аналогично, условие у = соответствует плоскости, перпендикулярной оси Оу и пересекающей ее в точке .
Обе плоскости пересекут поверхность z = f(x,y) и вырежут на ней плоские линии . Частная производная - точка с координатами , совпадает с производной в точке а частная производная совпадает с производной f'(x0,y) в точке . Эти производные равны тангенсам угла наклона касательных, проведенных, соответственно, к плоским линиям =f(x,) и
При переходе к пространству R" геометрический смысл не изменяется и соответствует тангенсу угла наклона касательной, проведенной к сечению гиперповерхности у = f(M) системой гиперплоскостей
, высвобождающих только одну координату .
Нетрудно показать, что если функции f и g имеют конечные частные производные, то конечные частные производные имеют и композиции этих функций вида и . При этом:
Дифференциал функции нескольких переменных
Функция y = f{M), определенная в области и непрерывная в точке , называется дифференцируемой в точке , если полное приращение в некоторой окрестности точки можно представить в виде:
где - постоянные; - бесконечно малые, стремящиеся к нулю при Если не все значения равны нулю, то величина является бесконечно малой первого порядка и называется главной линейной частью приращения дифференцируемой функции или ее полным дифференциалом.
Величина является бесконечно малой более высокого порядка. Таким образом, полное приращение дифференцируемой функции можно записать в виде
Для дифференцируемых функций предел отношения частных приращении к приращению соответствующей переменной имеет конечный предел при -»0, равный т.е. из дифференцируемости функции у = f(M) непосредственно вытекает существование конечных частных производных этой функции и их равенство коэффициентам . главной части разложения полного приращения.
Под дифференциалом независимой переменной обычно понимают приращение этой переменной, т.е.
Полным дифференциалом функции у = f(M) называется главная линейная часть полного приращения этой функции
Функция, имеющая дифференциал в данной области, называется дифференцируемой в этой области. Если функция у = f(M) дифференцируема в данной области, то в этой области она непрерывна.
Теорема. Дифференциал функции равен сумме произведений частных производных этой функции на дифференциалы соответcmвующих независимых переменных.
Доказательство: Пусть функция дифференцируема, т.е. имеет дифференциал . Для определения коэффициентов рассмотрим полное приращение функции . Тогда частное приращение функции по k-й переменной можно записать как . Отсюда следует, что . Переходя к пределу при это равенство можно записать в виде Аналогичные рассуждения справедливы для каждой из n компонент. Таким образом, с учетом вышесказанного, выражение для полного дифференциала функции df(M) можно записать как:Совокупность всех частных производных вектора можно рассматривать как координаты вектора, который называется вектором-градиентом . При этом формула для вычисления полного дифференциала может рассматриваться как скалярное произведение вектора-градиента и вектора с координатами, равными дифференциалам независимых переменных, который называется вектором-приращением . Скалярное произведение принимает максимальное значение при условии, что вектора - сомножители сонаправлены. Таким образом, направление вектора-градиента является направлением наиболее сильного изменения функции.
Необходимые условия дифференцируемости. Достаточные условия
Наличие конечной производной является необходимым и достаточным условием для дифференцируемости функции одной переменной. Для функции нескольких переменных существование конечных частных производных по всем независимым переменным, т.е. существование вектора-градиента в точке -необходимое условие дифференцируемости функции. Однако это условие не является достаточным для дифференцируемости функции многих переменных.
Достаточное условие дифференцируемости.
Теорема. Для того чтобы у = f(М), определенная в области D и непрерывная в точке была дифференцируема в этой точке, достаточно, чтобы эта функция имела непрерывные частные производные в некоторой окрестности , и эти частные производные были непрерывны в точке .
Следствием теоремы является существование в некоторой окрестности точки ограниченного вектора-градиента непрерывного в .
Дифференцирование функции, заданной неявно и композиции функций
Функция п переменных y = f(M) называется заданной неявно, если она задана уравнением , не разрешенным относительно у. В этом случае частные производные функции у = f(M) находятся в результате дифференцирования функции F по свободным переменным и по зависимой переменной у.
В случае, если у - функция одной переменной заданная уравнением
В двумерном случае, если у - функция двух переменных и , заданная уравнением
В общем случае, если у - функция n переменных, заданная уравнением то частные производные находятся по формулам:
Если в В задана сложная зависимость т.е. функция определена в области а семейство функций определены в и области изменения функций этого семейства содержатся во множестве А, то если функция определена в области А и непрерывна в , а семейство функций определены в В, непрерывны в и имеет в этой точке непрерывные первые производные, а также при условии, что функции:
являются непрерывными в точке и имеют в этой точке непрерывные первые производные, то .
Тогда при дифференциальном анализе функциональной зависимости справедливы следующие соотношения:
Если сложная функция имеет в точке непрерывные первые производные, то она является дифференцируемой в этой точке, и ее полный дифференциал первого порядка обладает свойством инвариантности и имеет вид:
Различие между полными дифференциалами простой и сложной функций состоит в том, что для простой функции приращение независимой переменной равно ее дифференциалу, а для сложных функций это равенство не выполняется.
Полные дифференциалы и частные производные высших порядков. Признак полного дифференциала
Частными производными функции y = f(M) в том случае, если они существуют не в одной точке, а на некотором множестве А, являются функции, определенные на этом множестве. Эти функции могут быть непрерывными и в некоторых случаях также могут иметь частные производные в различных точках области определения.
Частные производные от этих функций называются частными производными второго порядка или вторыми частными производными.
Частные производные второго порядка разбиваются на две группы:
- вторые частные производные от f по переменной
- смешанные частные производные от f по переменным
При последующем дифференцировании можно определить частные производные третьего порядка и т.д. Аналогичными рассуждениями определяются и записываются частные производные высших порядков.
Теорема. Если все входящие в вычисления частные производные, рассматриваемые как функции своих независимых переменных, непрерывны, то результат частного дифференцирования не зависит от последовательности дифференцирования.
Часто возникает потребность решения обратной задачи, которая состоит в определении того, является ли полным дифференциалом dy функции y = f(M) выражение вида , где - непрерывные функции с непрерывными производными первого порядка.
Необходимое условие полного дифференциала можно сформулировать в виде теоремы, которую примем без доказательства.
Теорема. Для того, чтобы дифференциальное выражение являлось в области полным дифференциалом функции у = f(M), определенной и дифференцируемой в этой области, необходимо, чтобы в этой области тождеcтвенно было выполнено условие для любой пары независимых переменных .
Задача вычисления полного дифференциала второго порядка функции у = f(M) может быть решена следующим образом.
Если выражение полного дифференциала также является дифференцируемым, то вторым полным дифференциалом (или полным дифференциалом второго порядка) можно считать выражение, полученное в результате применения операции дифференцирования к первому полному дифференциалу, т.е. Аналитическое выражение для второго полного дифференциала имеет вид:
С учетом того, что смешанные производные не зависят от порядка дифференцирования, формулу можно сгруппировать и представить виде квадратичной формы:
Матрица квадратичной формы А равна:
Пусть задана суперпозиция функций определенной в А и
, определенных в В. При этом . Тогда, если f и имеют непрерывные частные производные до второго порядка в точках , то существует второй полный дифференциал сложной функции следующего вида:
Как видно, второй полный дифференциал не обладает свойством инвариантности формы. В выражение второго дифференциала сложной функции входят слагаемые вида , которые отсутствуют в формуле второго дифференциала простой функции.
Построение частных производных функции у = f(M) более высоких порядков можно продолжать, выполняя последовательное дифференцирование этой функции:
, где индексы принимают значения от 1 до n, т.е. производная порядка m рассматривается, как частная производная первого порядка от производной порядка m -1. Аналогично можно ввести и понятие полного дифференциала порядка m функции y = f(M) как полного дифференциала первого порядка от дифференциала порядка
В случае простой функции двух переменных формула для вычисления полного дифференциала порядка n функции имеет вид
Применение оператора дифференцирования позволяет получить компактную и легко запоминающуюся форму записи для вычисления полного дифференциала порядка n функции у = f(М), аналогичную формуле бинома Ньютона. В двумерном случае она имеет вид:
Формула Тейлора
Используя формулы частных производных высших порядков, а также выражения для полных дифференциалов высшего порядка, можно построить многочлены Тейлора для функции многих переменных, обладающей непрерывными частными производными до m-го порядка включительно в некоторой окрестности радиуса R с центром в точке . Этот многочлен аналогичен многочлену Тейлора для функции одной переменной, записанному в дифференциальной форме:
Тогда многочлен Тейлора для функции n переменных можно записать в виде:
где используются полные дифференциалы соответствующих порядков с частными производными, значения которых определены для точки .
Если функция у = f(M) удовлетворяет условиям непрерывной дифференцируемости до (m + 1)-го порядка, то се абсолютное и относительное приращения соответственно, могут быть представлены следующими формулами:
Локальный экстремум функции нескольких переменных. Необходимое и достаточное условия. Исследование стационарных точек
Пусть функция у = f(М) определена и непрерывна в области А. Локальным максимумом этой функции называется внутренняя точка у которой существует такая ненулевая -окрестность для каждой точки из которой выполняется условие: .
Если каждой точки М из ненулевой — окрестности точки выполняется условие , то точка называется локальным минимумом функции у = f(M).
Рис. 4.2.
Точки локального минимума или максимума называются точками локального экстремума. Для этих точек характерно знакопостоянство величины абсолютного приращения в пределах ненулевой - окрестности. Для определения необходимого и достаточного признаков экстремальности функции предположим, что функция в области А не имеет точек разрыва и обладает дифференцируемостью до второго порядка. Как было указано выше, разложение абсолютного приращения имеет вид:
Главный член разложения полного приращения является знакопеременным, так как линейно зависит от приращений . Поэтому в точке у функции у = f(M) не может наблюдаться экстремума, если вектор-градиент этой функции точке будет отличен от нулевого вектора, т.е. хотя бы одна из частных производных не будет равна нулю. Таким образом, необходимым условием существования локального экстремума функции y = f(M) является условие df() = 0 или
Точки, в которых первые частные производные функции у = f(M) равны нулю или не существуют, называются критическими для данной функции. Критические точки, в которых первые частные производные функции у=f(M) существуют, называются стационарными. Функция многих переменных может достигать своего локального экстремума только в своей критической точке.
При обосновании достаточного условия существования экстремума введем дополнительное требование к функции y = f(M): эта функция должна иметь непрерывные производные второго порядка в ненулевой - окрестности точки . Тогда условием наличия локального экстремума в критической точке или условием знакопостоянства абсолютного приращения в этой точке будет требование знакопостоянства второго слагаемого в разложении , т.е. Влияние третьего и последующих членов разложения в этом случае будет пренебрежимо малым. Если формулу для вычисления сгруппировать и представить в виде квадратичной формы:
то требование знакопостоянства сводится к требованию знакоопределенности матрицы квадратичной формы А в критической точке . В этом случае, если матрица квадратичной формы является положительно определенной, то в точке функция имеет локальный минимум, а если матрица А отрицательно определена - то локальный максимум.
Условие знакопостоянства полного относительного приращения выполняется в точках локальной выпуклости, определение которых можно дать по аналогии с функциями одной переменной.
Точка называется точкой локальной выпуклости функции у = f(M), непрерывной и дифференцируемой в области M, если она является внутренней точкой этой области и в некоторой ненулевой -окрестности точки выполняется условие: полное относительное приращение знакопостоянно.
Если точка называется точкой выпуклости вниз.
Если точка называется точкой выпуклости вверх.
Если условие локальной выпуклости вверх или вниз выполняется во всех точках области то функция называется однообразно выпуклой на области А .
Достаточным условием существования локальной выпуклости функции нескольких переменных у = f(M) в точке является знакопостоянство полного дифференциала второго порядка этой функции. Это несложно показать, воспользовавшись формулой разложения:
и проведя рассуждения аналогичные доказательству достаточного условия существования локального экстремума. Таким образом, знакопостоянство полного относительного приращения функции y = f(M) в некоторой ненулевой -окрестности точки определяется знакопостоянством полного второго дифференциала функции y = f(M) в точке .
Если , то функция имеет в точке локальную выпуклость вниз. Если , то функция имеет в точке локальную выпуклость вверх. Достаточное условие существования локального экстремума в критической точке М0 кроме необходимого признака df() = 0 включает в свой состав требование наличия локальной выпуклости в этой точке.
Условный экстремум функций нескольких переменных. Глобальный экстремум
Задача отыскания экстремума в случае функции многих переменных может быть поставлена как задача об условном экстремуме функции y = f(M) с ограничениями вида g,(M) = 0, которые называются уравнениями связи,. Разумеется, функции должны быть определены, непрерывны и непрерывно дифференцируемы в области . Таким образом, ведется поиск экстремума не на всей области определения, а лишь на множестве точек, удовлетворяющих уравнениям связи. Такой экстремум называется условным.
Наиболее простым способом нахождения условного экстремума функции двух переменных является сведение задачи к отысканию экстремума функции одной переменной. Допустим, требуется найти экстремум функции u = f(x>y) при условии, что F(xy) = 0. Для этого из уравнения F(x,y) = 0 выражают одну из переменных через другую, например, Подставив это выражение в f(x,y), получают - функцию одной переменной, которую исследуют на обычный экстремум. Однако, в большинстве более сложных случаев решить этим способом задачу отыскания экстремума не удается.
Для отыскания условного экстремума в общем случае применяется метод множителей Лагранжа. Для этого вводится вспомогательная функция Лагранжа:
Эта функция зависит от и значений множителей Лагранжа
Теорема. Если точка является точкой условного экстремума функции у = f(M) при условиях , то существует такое что точка является точкой экстремума функции
В качестве необходимых условий существования экстремума формируется система уравнений, решения которой и требуется найти:
Решения системы уравнений образуют множество критических точек с переменными .В каждой указанной точке должно выполняться условие или .
На практике в большинстве случаев ставится задача исследования функции у = f(M), определенной на множестве точек, удовлетворяющих системе ограничений. Такое множество точек образует область, границами которой являются уравнения связи.
Наибольшее или наименьшее значение функции в данной области называется абсолютным или глобальным экстремумом функции (соответственно абсолютным максимумом или абсолютным минимумом) в этой области.
Согласно теореме Вейерштрасса функция непрерывная в ограниченной и замкнутой области, достигает в этой области своего наибольшего и своего наименьшего значений.
Теорема. Абсолютный (глобальный) экстремум функции в данной области достигается либо в критической точке функции, принадлежащей этой области, либо в граничной точке области.
Mетод наименьших квадратов
При определении вида эмпирической функции у = f(x) обычно предполагается, что это наиболее гладкая кривая, согласованная с экспериментальными данными. Кроме того, для выбора этой функции привлекаются дополнительные соображения, как правило, не математического характера (теоретические модели, опыт предшествующих исследований, и т.п.).
Эта задача может быть решена в ходе регрессионного анализа, который изучается в курсе теории вероятностей, но решить ее можно и математическими методами. Согласно наиболее распространенному и теоретически обоснованному методу наименьших квадратов в качестве неизвестных параметров функции у = f(x) выбираются такие значения, которые соответствуют минимальному значению суммы квадратов отклонений эмпирических значений от значений функции вычисленных
Разность называется невязкой. В качестве критерия согласия или величины отклонения можно было взять обычную сумму невязок или их абсолютных величин, но делать это нецелесообразно, поскольку в первом случае сумма невязок может быть малой или, даже, равняться нулю при значительном разбросе экспериментальных данных из-за того, что положительные отклонения будут скомпенсированы отрицательными. Сумма абсолютных величин невязок лишена этого недостатка, но она имеет другой - она не является дифференцируемой, что существенно затрудняет решение задачи.
В ходе решения задачи отыскания оптимальных параметров аппроксимационной функции у = f(х) возникает необходимость поиска экстремума функции нескольких переменных, поэтому прежде чем решать эту задачу для конкретных эмпирических функций, необходимо рассмотреть свойства функций нескольких переменных.
Предположим, что функция y = f(x) - линейная, т.е. Если это выражение приближенно описывает зависимость между х и у, то сумма квадратов невязок должна быть минимальной, т.е. значения параметров должны соответствовать минимуму величины:
Это функция двух переменных она непрерывна, дифференцируема, неотрицательна и ограничена снизу. Для того чтобы найти ее наименьшее значение, необходимо ее частные производные приравнять к нулю:
Таким образом, для нахождения параметров необходимо решить систему уравнений:
Эта линейная система уравнений имеет единственное решение, поскольку ее определитель:
не равен нулю.
Вторые производные функции S равны:
Главные миноры матрицы квадратичной формы положительны, т.е.
Таким образом, значения , найденные при решении системы уравнений, соответствуют минимуму функции S.
Поскольку система невырождена, то решение можно найти по правилу Крамера:
Рекомендую подробно изучить предметы: |
Ещё лекции с примерами решения и объяснением: |