birmaga.ru
добавить свой файл

1

Лекция 30. Статистические методы обработки. Задачи обработки результатов моделирования. Критерий согласия Колмогорова. Критерий согласия Пирсона. Критерий согласия Смирнова. Критерий согласия Стьюдента. Критерий согласия Фишера.

Статистические методы обработки

Рассмотрим некоторые особенности статистических методов, используемых для обработки результатов моделирования системы S. Для случая исследования сложных систем при большом числе реализации N в результате моделирования на ЭВМ получается значительный объем информации о состояниях процесса функционирования системы. Поэтому необходимо так организовать в процессе вычислений фиксацию и обработку результатов моделирования, чтобы оценки для искомых характеристик формировались постепенно по ходу моделирования, т.е. без специального запоминания всей информации о состояниях процесса функционирования системы S.

Если при моделировании процесса функционирования конкретной системы S учитываются случайные факторы, то и среди результатов моделирования присутствуют случайные величины. В качестве оценок для искомых характеристик рассчитывают средние значения, дисперсии, корреляционные моменты и т.д.

Пусть в качестве искомой величины фигурирует вероятность некоторого события А. В качестве оценки для искомой вероятности р=Р(А) используется частость наступления события m/N, где т – число случаев наступления события А; N – число реализаций. Такая оценка вероятности появления события А является состоятельной, несмещенной и эффективной. В случае необходимости получения оценки вероятности в памяти ЭВМ при обработке результатов моделирования достаточно накапливать лишь число т (при условии, что N задано заранее).

Аналогично при обработке результатов моделирования можно подойти к оценке вероятностей возможных значений случайной величины, т.е. закона распределения. Область возможных значений случайной величины разбивается на п интервалов. Затем накапливается количество попаданий случайной величины в эти интервалы mk, . Оценкой для вероятности попадания случайной величины в интервал с номером k служит величина mk/N. Таким образом, при этом достаточно фиксировать n значений mk при обработке результатов моделирования на ЭВМ.


Для оценки среднего значения случайной величины накапливается сумма возможных значений случайной величины уk, , которые она принимает при различных реализациях. Тогда среднее значение

.

При этом ввиду несмещенности и состоятельности оценки

М[] = М[] = ; D[] = D[]/N = /N.

В качестве оценки дисперсии случайной величины при обработке результатов моделирования можно использовать

.

Непосредственное вычисление дисперсии по этой формуле нерационально, так как среднее значение изменяется в процессе накопления значений уk. Это приводит к необходимости запоминания всех N значений уk. Поэтому более рационально организовать фиксацию результатов моделирования для оценки дисперсии с использованием следующей формулы:

.

Тогда для вычисления дисперсии достаточно накапливать суммы: значений yk и их квадратов .

Для случайных величин и с возможными значениями xk и yk корреляционный момент

или

.

Последнее выражение вычисляется при запоминании в процессе моделирования небольшого числа значений.

Если при моделировании системы S искомыми характеристиками являются математическое ожидание и корреляционная функция случайного процесса y(t) (в интервале моделирования [0,Т]), для нахождения оценок этих величин указанный интервал разбивают на отрезки с постоянным шагом t и накапливают значения процесса yk(t) для фиксированных моментов времени t=tm=mt.


При обработке результатов моделирования математическое ожидание и корреляционную функцию запишем так:

;

,

где и и z пробегают все значения tm.

Для уменьшения затрат машинных ресурсов на хранение промежуточных результатов последнее выражение также целесообразно привести к следующему виду:

.

Отметим особенности фиксации и обработки результатов моделирования, связанные с оценкой характеристик стационарных случайных процессов, обладающих эргодическим свойством. Пусть рассматривается процесс y(t). Тогда с учетом этих предположений поступают в соответствии с правилом: среднее по времени равно среднему по множеству. Это означает, что для оценки искомых характеристик выбирается одна достаточно продолжительная реализация процесса y(t), для которой целесообразно фиксировать результаты моделирования. Для рассматриваемого случая запишем математическое ожидание и корреляционную функцию процесса:

;

.

На практике при моделировании на ЭВМ системы S интервал (0, Т) оказывается ограниченным и, кроме того, значения y(t) удается определить только для конечного набора моментов времени tm. При обработке результатов моделирования для получения оценок у и B() используем приближенные формулы:

;

,

которые целесообразно преобразовать к виду, позволяющему эффективно организовать порядок фиксации и обработки результатов моделирования на ЭВМ.

Задачи обработки результатов моделирования

При обработке результатов машинного эксперимента с моделью Мм наиболее часто возникают следующие задачи:


  • определение эмпирического закона распределения случайной величины,

  • проверка однородности распределений,

  • сравнение средних значений и дисперсий переменных, полученных в результате моделирования, и т.д.

Эти задачи с точки зрения математической статистики являются типовыми задачами по проверке статистических гипотез.

Задача определения эмпирического закона распределения случайной величины наиболее общая из перечисленных, но для правильного решения требует большого числа реализаций N. В этом случае по результатам машинного эксперимента находят значения выборочного закона распределения Fэ(y) (или функции плотности fэ(у)) и выдвигают нулевую гипотезу Н0, о том, что полученное эмпирическое распределение согласуется с каким-либо теоретическим распределением. Проверяют эту гипотезу Н0 с помощью статистических критериев согласия Колмогорова, Пирсона, Смирнова и т.д., причем необходимую в этом случае статистическую обработку результатов ведут по возможности в процессе моделирования системы S на ЭВМ.

Для принятия или опровержения гипотезы выбирают некоторую случайную величину U, характеризующую степень расхождения теоретического и эмпирического распределения, связанную с недостаточностью статистического материала и другими случайными причинами. Закон распределения этой случайной величины зависит от закона распределения случайной величины и числа реализации N при статистическом моделировании системы S. Если вероятность расхождения теоретического и эмпирического распределения P{UтU} велика в понятиях применяемого критерия согласия, проверяемая гипотеза о виде распределения Н0 не опровергается. Выбор вида теоретического распределения F(y) (или f(y)) проводится по графикам (гистограммам) Fэ(y) (или fэ(y)), выведенным на печать или на экран дисплея.


Рассмотрим особенности использования при обработке результатов моделирования системы S на ЭВМ ряда критериев согласия.

Критерий согласия Колмогорова


Основан на выборе в качестве меры расхождения U величины
D = max[Fэ(y) – F(y)].

Из теоремы Колмогорова следует, что = D при N имеет функцию распределения

F(z) = P{<z} = , z>0.

Если вычисленное на основе экспериментальных данных значение  меньше, чем табличное значение при выбранном уровне значимости , то гипотезу H0 принимают; в противном случае расхождение между Fэ(у) и F(y) считается неслучайным и гипотеза H0 отвергается.

Критерий Колмогорова для обработки результатов моделирования целесообразно применять в тех случаях, когда известны все параметры теоретической функции распределения. Недостаток использования этого критерия связан с необходимостью фиксации в памяти ЭВМ для определения D всех статистических частот с целью упорядочения в порядке возрастания.

Критерий согласия Пирсона


Основан на определении в качестве меры расхождения U величины

2=,

где тi количество значений случайной величины , попавших в
i-й подынтервал; pi вероятность попадания случайной величины в
i-й подынтервал, вычисленная из теоретического распределения; d количество подынтервалов, на которые разбивается интервал измерения в машинном эксперименте.

При N закон распределения величины U, являющейся мерой расхождения, зависит только от числа подынтервалов и приближается к закону распределения 2 (хи-квадрат) с (dr – 1) степенями свободы, где r – число параметров теоретического закона распределения.


Из теоремы Пирсона следует, что, какова бы ни была функция распределения F(y) случайной величины , при N распределение величины 2 имеет вид:

,

где Г(k/2) – гамма-функция; z – значение случайной величины 2; k= r  1 число степеней свободы. Функции распределения Fk(z) табулированы.

По вычисленному значению U = 2 и числу степеней свободы k с помощью таблиц находится вероятность P{2}. Если эта вероятность превышает некоторый уровень значимости , то считается, что гипотеза H0 о виде распределения не опровергается результатами машинного эксперимента.

Критерий согласия Смирнова


При оценке адекватности машинной модели Мм реальной системе S возникает необходимость проверки гипотезы H0, заключающейся в том, что две выборки принадлежат одной и той же генеральной совокупности. Если выборки независимы и законы распределения совокупностей F(u) и F(z), из которых извлечены выборки, являются непрерывными функциями своих аргументов u и z, то для проверки гипотезы H0 можно использовать критерий согласия Смирнова, применение которого сводится к следующему. По имеющимся результатам вычисляют эмпирические функции распределения Fэ(u) и Fэ(z) и определяют

D = max |Fэ(u) – Fэ(z)|.

Затем при заданном уровне значимости находят допустимое отклонение

,

где N1 и N2объемы сравниваемых выборок для Fэ(u) и Fэ(z), и проводят сравнение значений D и D: если D>D, то нулевую гипотезу H0 о тождественности законов распределения F(u) и F(z) с доверительной вероятностью =1 –  отвергают.

Критерий согласия Стьюдента


Сравнение средних значений двух независимых выборок, взятых из нормальных совокупностей с неизвестными, но равными дисперсиями D[]=D[], сводится к проверке нулевой гипотезы Н0: = u – z = 0 на основании критерия согласия Стьюдента (t-критерия). Проверка по этому критерию сводится к выполнению следующих действий. Вычисляют оценку

,

где N1 и N2 объемы выборок для оценки u и z соответственно;
и оценки дисперсий соответствующих выборок.

Затем определяют число степеней свободы k = N1 + N2 – 2, выбирают уровень значимости и по таблицам находят значение t. Расчетное значение t сравнивается с табличным t; если |t| < t, то гипотеза H0 не опровергается результатами машинного эксперимента.

Критерий согласия Фишера

Задача сравнения дисперсий сводится к проверке нулевой гипотезы H0, заключающейся в принадлежности двух выборок к одной и той же генеральной совокупности. Пусть необходимо сравнить две дисперсии и , полученные при обработке результатов моделирования и имеющие k1 и k2 степеней свободы соответственно, причем >. Для того чтобы опровергнуть нулевую гипотезу H0: =, необходимо при уровне значимости указать значимость расхождения между и . При условии независимости выборок, взятых из нормальных совокупностей, в качестве критерия значимости используется распределение Фишера (F-критерий) F=/, которое зависит только от числа степеней свободы k1=N1 – 1, k2=N2 – 1, где N1 и N2 объемы выборок для оценки и соответственно.


Алгоритм применения критерия Фишера следующий:


  1. вычисляется выборочное отношение F=/;

  2. определяется число степеней свободы k1=N1 – 1 и k2=N2 – 1;

  3. при выбранном уровне значимости по таблицам F-распределения находятся значения границ критической области ;

  4. проверяется неравенство F1  F  F2; если это неравенство выполняется, то с доверительной вероятностью нулевая гипотеза H0: = может быть принята.

Рассмотренные оценки искомых характеристик процесса функционирования системы S, полученные в результате машинного эксперимента с моделью Мм, являются простейшими и охватывают большинство случаев, встречающихся в практике обработки результатов моделирования системы для целей ее исследования и проектирования.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК


  1. Советов Б.Я. Моделирование систем : учеб. для вузов / Б.Я. Советов,
    С.А. Яковлев. 3-е изд., перераб. и доп. М. : Высш. шк., 2001. 343 с.

  2. Тарасик В.П. Математическое моделирование технических систем: учеб. для вузов / В.П. Тарасик. М.: Наука, 1997. 600 с.

  3. Введение в математическое моделирование: учеб. пособие для вузов / под ред. П.В.Тарасова. М.: Интермет Инжиниринг, 2000. 200 с.

  4. Советов Б.Я. Моделирование систем : учеб. для вузов / Б.Я. Советов,
    С.А. Яковлев. 2-е изд. М.: Высшая школа, 1998. 319 с.
  5. Шеннон Р. Имитационное моделирование систем – искусство и наука /

    Р. Шеннон. М.: Мир, 1978. 308 с.


  6. Максимей И.В. Имитация моделирования на ЭВМ / И.В. Максимей.
    М.: Радио и связь, 1988. 232 с.

  7. Литвинов В.В. Методы построения имитационных систем / В.В. Литвинов Т.П.Марьянович. Киев Наукова Думка 1991. 120 с.

  8. Шрайбер Т.Дж. Моделирование на GPSS / Т.Дж. Шрайбер.
    М.: Машиностроение, 1980. 592 с.

  9. Технология системного моделирования / Е.Ф. Аврамчук [и др.]. М. Машиностроение 1988. 520 с.

  10. Альянах И.Н. Моделирование вычислительных систем / И.Н. Альянах.
    Л. Машиностроение 1988. 233 с.

  11. Балакирев В.С. Оптимальное управление процессами химической технологии / В.С. Балакирев В.М. Володин А.М. Цирлин. М. Химия 1978. 384 с.

  12. Пакеты прикладных программ: Математическое моделирование / под ред. А.А. Самарского. М.: Наука, 1989. 128 с.

  13. Системное обеспечение пакетов прикладных программ / под ред.
    А.А. Самарского. М.: Наука, 1990. 208 с.