birmaga.ru
добавить свой файл

1

Лекция 23. Оценка параметров регрессионной модели. Планы экспериментов и их свойства. План однофакторного эксперимента

Оценка параметров регрессионной модели

Исходными данными для получения оценок параметров регрессионной модели технической системы (т.е. оценок искомых коэффициентов регрессии ) является информация о значениях управляемых факторов (или неуправляемых при проведении пассивного эксперимента) и функции отклика Y. Эту информацию можно представить в виде матрицы X значений факторов во всех N опытах, предусмотренных спектром плана эксперимента, и вектора-столбца полученных в этих опытах значений функции отклика Y:

(6.12)

(6.13)

где вектор-строка значений факторов в i-м опыте; xij значение j-го фактора в i-м опыте; k количество факторов; N количество опытов; значение функции отклика Y в i-м опыте (если проводились параллельные опыты, т. е. осуществлялось дублирование опытов, то вместо используются оценки их математических ожиданий, т.е. выборочные средние ).

Значения базисных функций во всех опытах представляют собой матрицу F, называемую матрицей базисных функций

(6.14)

где значение m-ой базисной функции в i-м опыте; вектор-строка значений базисных функций в i-м опыте.

Используя информацию об X, и F, необходимо найти оценки коэффициентов регрессии, представляемые вектором-столбцом


(6.15)

где bk значение оценки коэффициента регрессии при базисной функции .

Так как функция отклика Y случайная величина, поскольку на ее значения в различных опытах оказывает влияние случайная помеха ε, то оценки коэффициентов регрессии будут случайными величинами.

Уравнение регрессии устанавливает зависимость между оценкой математического ожидания функции отклика и факторами . Общий вид этой зависимости

(6.16)

В связи с наличием помехи значение функции отклика в i-м опыте будет отличаться от . Для определения можно составить выражение

, (6.17)

где εi - невязка уравнения регрессии в i-м опыте.

Невязка характеризует отклонение значений функции отклика в опытах от получаемых с помощью регрессионной модели (6.16). Она возникает по двум причинам: из-за ошибки эксперимента и из-за непригодности (приближенности) выбранной структуры факторной математической модели. Причем эти причины смешаны и нельзя сказать, какая из них преобладает.

Если постулировать, что модель пригодна, то невязка будет порождаться только ошибкой опыта. Тогда для определения коэффициентов уравнения (6.16) невязку надо минимизировать. Для этого в регрессионном анализе используется метод наименьших квадратов (МНК). Составляется функция, представляющая собой сумму квадратов невязок, и осуществляется ее минимизация, т.е.

(6.18)


Подставим значение εi из выражения (6.17)

(6.19)

В выражении (6.19) коэффициенты bm рассматриваются как неизвестные переменные, которые наилучшим образом соответствуют полученным результатам эксперимента. Значения этих коэффициентов, при которых достигается минимум функции Е, принимаются в качестве оценок коэффициентов регрессии. Минимум функции Е имеет место при равенстве нулю частных производных этой функции по переменным b0, b1, …, bd:



После преобразований получим систему линейных неоднородных алгебраических уравнений относительно искомых оценок коэффициентов регрессии b0, b1, …, bd:

(6.20)

Очевидно, что коэффициенты при неизвестных переменных этой системы уравнений являются элементами матрицы Ф, определяемой из выражения

, (6.21)

в котором F представляет собой матрицу базисных функций (6.14). Значения элементов матрицы F известны из проведенного эксперимента. Следовательно, элементы матрицы Ф оказываются известными коэффициентами системы уравнений (6.20). Выпишем матрицу Ф

(6.22)

Матрицу Ф называют информационной матрицей Фишера. Она содержит (d +1) строк и (d+1) столбцов, причем, элемент j-й строки m-го столбца представляет собой сумму Матрица Ф симметрична относительно главной диагонали, что упрощает составление системы алгебраических уравнений (6.20) для регрессионной модели.


Систему уравнений (6.20) можно также записать в матричной форме

(6.23)

Система уравнений (6.20) имеет единственное решение, если определитель матрицы Ф не равен нулю. В этом случае матрица Ф будет невырожденной. Выполнение пятой предпосылки регрессионного анализа, изложенной в предыдущем параграфе, исключает возникновение вырожденности.

Решение системы уравнений (6.20) обычно осуществляют методом Гаусса. При небольшом числе определяемых коэффициентов bk можно использовать правило Крамера.

Полученные методом наименьших квадратов оценки b0, b1, …, bd действительных значений коэффициентов регрессии β0, β1…, βd обладают следующими свойствами:

1) математические ожидания оценок , т. е. оценки bj несмещенные;

2) дисперсии оценок коэффициентов регрессии минимальны и равны

(6.24)

а корреляционный момент

(6.25)

где Cjj, Cjm элементы матрицы Ф-1, обратной к информационной; дисперсия случайной помехи;

3) оценки b0, b1, …, bd подчиняются совместному (d + 1)-мерному нормальному распределению.

Планы экспериментов и их свойства

Для проведения активных экспериментов разработано множество различных планов. Планы учитывают как особенности структуры регрессионных моделей, так и требования их эффективности с позиций повышения точности получаемых моделей и снижения затрат на проведение эксперимента.


При построении линейных моделей или нелинейных, содержащих только взаимодействия факторов, но без квадратов этих факторов (регрессий первого порядка), каждый фактор можно варьировать только на двух уровнях. Для получения таких моделей используют планы первого порядка.

Известно несколько разновидностей планов первого порядка. Эти планы различаются в зависимости от структуры регрессионной модели. Они предназначены для планирования следующих видов экспериментов:


  • однофакторного (классического) эксперимента;

  • полного факторного эксперимента;

  • дробного факторного эксперимента.

Если в регрессионную модель входят факторы в квадрате или с более высокими степенями, то необходимо не менее трех уровней варьирования факторов. При построении квадратичных моделей применяют планы второго порядка. Эти планы часто используют в качестве своего ядра какой-либо план первого порядка, который дополняется так называемыми звездными точками.

Планы различают по степени насыщенности. План называют насыщенным, если общее число точек плана равно числу неизвестных параметров регрессионной модели. Такой план позволяет получить экспериментальную факторную модель при минимальных затратах, так как обеспечивает минимум числа опытов.

План называется композиционным, если в спектр его в качестве составной части входят точки спектра плана, который был реализован при построении более простой модели. Композиционность плана позволяет реализовать принцип постепенного усложнения модели при минимальных затратах, так как при этом используются результаты опытов, выполненных для получения простой модели. Многие планы второго порядка являются композиционными.

Важным свойством плана является его ортогональность. У ортогональных планов информационная матрица Фишера Ф диагональная, а столбцы матрицы базисных функций F попарно ортогональны. Для ортогонального плана при заданных значениях диагональных элементов матрицы Ф дисперсии оценок коэффициентов регрессии bk минимальны. Причем эти оценки получаются независимыми, что существенно облегчает их вычисление и анализ.


При изменении вида плана изменяется матрица Ф, что влияет на дисперсии оценок коэффициентов регрессии. Различают D-, А- и E-оптимальные планы. Они обеспечивают различные формы эллипсоидов рассеивания оценок. D-оптимальный план минимизирует обобщенную дисперсию оценок коэффициентов регрессии и обеспечивает минимальный объем эллипсоида их рассеивания. А-оптимальный план минимизирует среднюю дисперсию всех оценок, а эллипсоид имеет наименьшую сумму квадратов длин осей. Эллипсоид рассеивания у Е-оптимального плана имеет минимальную длину своей наибольшей оси.

В зависимости от возможностей предсказания отклика по уравнению регрессии различают планы ротатабельные и униформные. План называется ротатабельным, если дисперсия предсказания отклика постоянна на фиксированном расстоянии от центра эксперимента. Униформный план обеспечивает практически постоянное ее значение в некоторой области факторного пространства. Свойства ротатабельности или униформности обеспечиваются соответствующим выбором точек матрицы спектра плана. Задача выбора оптимального плана довольно сложная и в большинстве случаев не имеет аналитического решения. Поэтому поиск оптимальных планов обычно осуществляется численными методами на ЭВМ.

Рассмотрим основы построения и основные свойства планов первого порядка.

План однофакторного эксперимента


Однофакторный (классический) эксперимент предназначен для получения линейной экспериментальной факторной модели вида

(6.26)

Однофакторный эксперимент предусматривает поочередное варьирование каждого из факторов при фиксированных на некотором уровне значениях остальных факторов. Фактор xi варьируют на двух уровнях xiв и xiн, а все остальные при этом должны находиться в точке центра эксперимента , . Для нормированных факторов хiв = +1, хiн = 1, хj = 0. С учетом этого составим матрицу спектра плана однофакторного эксперимента


(6.27)

Число точек плана в этом случае N = 2k, где k количество факторов. Точки спектра плана располагаются в центрах граней гиперкуба.
На рис. 6.4, а показано расположение точек для двумерного случая, а
на рис. 6.4, б — для трехмерного.





Рис. 6.4. Расположение точек спектра однофакторного эксперимента:

апри двух факторах; б – при трех факторах

Вектор базисных функций имеет вид

(6.28)

а матрица F численных значений базисных функций отличается от матрицы спектра плана Х только одним дополнительным столбцом, соответствующим базисной функции

(6.29)

Матрица базисных функций F обладает очевидными свойствами:


  1. (6.30)

(6.31)

  1. (6.32)

(6.33)

  1. (6.34)

где N – число точек спектра плана; – значение m-й базисной функции в i-м опыте.

Согласно выражению (6.34) векторы-столбцы всех базисных функций попарно ортогональны.

Используя свойства (6.32)(6.34) и выражение (6.22), легко составить информационную матрицу Фишера Ф
= FTF


(6.35)

Так как матрица Ф диагональная, то план однофакторного эксперимента ортогональный и коэффициенты регрессии некоррелированы друг с другом. Для определения дисперсии оценок коэффициентов регрессии (6.26) вычислим обращенную матрицу Фишера.

(6.36)

Искомые дисперсии оценок коэффициентов регрессии определяются произведениями дисперсии помехи на соответствующие диагональные элементы матрицы Ф-1 :

(6.37)

Очевидно, что точность получаемой модели в этом случае невысокая, так как коэффициенты регрессии bm, (кроме коэффициента b0) имеют высокое значение дисперсии. Поэтому однофакторный эксперимент следует признать явно неудовлетворительным для построения модели технической системы. В связи с этим в настоящее время он практически не применяется. Следует отметить, что рассмотренный план обладает свойством ротатабельности.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК


  1. Советов Б.Я. Моделирование систем : учеб. для вузов / Б.Я. Советов,
    С.А. Яковлев. 3-е изд., перераб. и доп. М. : Высш. шк., 2001. 343 с.

  2. Тарасик В.П. Математическое моделирование технических систем: учеб. для вузов / В.П. Тарасик. М.: Наука, 1997. 600 с.

  3. Введение в математическое моделирование: учеб. пособие для вузов / под ред. П.В.Тарасова. М.: Интермет Инжиниринг, 2000. 200 с.

  4. Советов Б.Я. Моделирование систем : учеб. для вузов / Б.Я. Советов,
    С.А. Яковлев. 2-е изд. М.: Высшая школа, 1998. 319 с.

  5. Шеннон Р. Имитационное моделирование систем – искусство и наука /

    Р. Шеннон. М.: Мир, 1978. 308 с.


  6. Максимей И.В. Имитация моделирования на ЭВМ / И.В. Максимей.
    М.: Радио и связь, 1988. 232 с.

  7. Литвинов В.В. Методы построения имитационных систем / В.В. Литвинов Т.П.Марьянович. Киев Наукова Думка 1991. 120 с.

  8. Шрайбер Т.Дж. Моделирование на GPSS / Т.Дж. Шрайбер.
    М.: Машиностроение, 1980. 592 с.

  9. Технология системного моделирования / Е.Ф. Аврамчук [и др.]. М. Машиностроение 1988. 520 с.

  10. Альянах И.Н. Моделирование вычислительных систем / И.Н. Альянах.
    Л. Машиностроение 1988. 233 с.

  11. Балакирев В.С. Оптимальное управление процессами химической технологии / В.С. Балакирев В.М. Володин А.М. Цирлин. М. Химия 1978. 384 с.

  12. Пакеты прикладных программ: Математическое моделирование / под ред. А.А. Самарского. М.: Наука, 1989. 128 с.

  13. Системное обеспечение пакетов прикладных программ / под ред.
    А.А. Самарского. М.: Наука, 1990. 208 с.