lektsia 8

Лекция 8. Планирование эксперимента
1. Основные понятия и определения
2. Полный факторный эксперимент (ПФЭ)
3. Матрица планирования
4. Обработка результатов эксперимента
5. Получение регрессионной зависимости методом наименьших квадратов (МНК)


1.Основные понятия и определения
При экспериментально-статистическом исследовании объекта связь между входными и выходными параметрами системы описывается обычно полиномом. Для оценки коэффициентов полинома, аппроксимирующего действительную зависимость, необходимо располагать статистическим материалом, характеризующим состояние системы в процессе функционирования. Эта информация может быть получена либо путем пассивного наблюдения за системой (пассивный эксперимент), либо путем активного вмешательства в функционирование системы, то есть путем постановки опытов в определенных точках 13EMBED Unknown1415 в допустимой области пространства управления входных параметров, называемых факторами
Планирование эксперимента - это процедура выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленных задач с требуемой точностью, методов математической обработки их результатов и принятия решений.
Фактором называется входная переменная величина, принимающая в заданный момент времени определенное значение. Факторы соответствуют каналам воздействия на объект исследования.
Факторы могут быть количественными и качественными. Качественными факторами, в отличие от количественных, нe cooтветcтвуeт числовая шкала.
Основные требования, предъявляемые к факторам:
управляемость, то есть возможность установки и поддержания выбранного уpoвня фaктора в течение всего опыта или его изменения по заданной программе;
совместимость и независимость, то есть осуществимость и безопасность всех запланированных комбинаций факторов и возможность установления факторов на любом уровне вне зависимости от уровней других факторов;
однозначность фактора.
2. Полный факторный эксперимент (ПФЭ)
Рассмотрим общий случай, когда имеются k переменных x1,x2,,xk (будем называть их входными переменными или факторами) и выходная переменная у - отклик. Требуется выяснить, какой зависимостью они связаны. Простейшей - является линейная модель:
13EMBED Unknown1415, (1)
Для определения величин коэффициентов b0, 13EMBED Unknown1415 необходимо провести опыты, в каждом из которых факторы x1,x2,,xk принимают определенные значения. Число таких значений зависит от поставленной задачи. Если нас удовлетворяет модель (1), то достаточно двух значений для каждого фактора. В случае одного фактора это объясняется тем, что прямую линию можно провести через две точки. Для построения квадратичной модели двух уровней уже недостаточно, это же, очевидно, относится и к более сложным моделям.
3. Матрица планирования
Матрица планирования - значения факторов приводятся в кодированном виде, значения отклика в реальном масштабе.
Матрица планирования имеет ряд свойств, наиболее важными из которых для нас являются следующие три:
a) симметричность сумма всех элементов столбца каждого фактора равна нулю;
б) нормированность сумма квадратов всех элементов каждого столбца не зависит от рассматриваемого фактора и равна N;
в) ортогональность - сумма произведений соответствующих элементов двух столбцов разных факторов равна нулю.

4. Обработка результатов эксперимента

Одной из важнейших характеристик случайной величины является дисперсия, которая показывает степень ее сосредоточенности относительно среднего значения. В нашем случае дисперсия позволяет оценить уровень погрешностей в измерениях.
Дисперсией называется среднее значение квадрата отклонений величины от ее среднего значения:
13EMBED Unknown1415
где 13EMBED Unknown1415 - среднее арифметическое значение параметров оптимизации в некоторой точке плана, 13EMBED Unknown1415 - число параллельных опытов; 13EMBED Unknown1415 - число степеней свободы f , равное в этом случае количеству опытов минус единица. При дублировании опытов для вычисления среднего использована одна степень свободы равная единице.
При расчете среднего значения суммируют все измерения и делят на их число. При этом надо исключить резко отличающиеся результаты, так называемые выбросы, например, воспользовавшись критерием Стьюдента t(p, f ), где p - уровень значимости. В качестве р выбирается такое число, чтобы событие с этой вероятностью считалось практически невозможным; обычно полагают р = 0.05 :
13EMBED Unknown1415
Значение 13EMBED Unknown1415 берут из таблицы t(p, f) - распределения Стьюдента. Опыт считается выбросом, если экспериментальное значение критерия 13EMBED Unknown1415 при обычно используемом уровне значимости 0.05 по модулю больше табличного. Такой расчет справедлив, если распределение всех результатов измерения является нормальным.
После того как реализованы опыты во всех точках плана и определены их дисперсии, следует убедиться в однородности дисперсий. Это является одним из требований регрессионного анализа, применение которого при исследовании свойств получаемых моделей возможно только при соблюдении всех его предпосылок.
Проверка однородности дисперсий проводится по различным критериям. Если число дисперсий больше двух, одна из них значительно превышает остальные и выполняется условие равного числа опытов во всех точках плана, то используется критерий Кохрена G(p,f1,f2), во всех других используют критерий Фишера.
13EMBED Unknown1415
Число степеней свободы для числителя f1=nmax-1, для знаменателя - f2=N, где N число опытов.
Дисперсии однородны, если 13EMBED Unknown1415
Если используют критерий Фишера F(p, f1, f2), то
13EMBED Unknown1415
Если при числе степеней свободы числителя 13EMBED Unknown1415, а знаменателя 13EMBED Unknown1415 для уровня значимости 0.05 13EMBED Unknown1415, то дисперсии однородны.

Убедившись в однородности дисперсий, определяем диcпepсию параметра оптимизации по всем проведенным экспериментам или дисперсию воспроизводимости эксперимента:
13EMBED Unknown1415
Эта дисперсия показывает, насколько хорошо воспроизводятся (повторяются) значения отклика в случае постановки нескольких опытов при неизменных значениях факторов, то есть она характеризует величину помех (погрешностей) в эксперименте, иначе, точность эксперимента.
Реализовав эксперимент и вычислив средние значения откликов для каждой точки плана, необходимо проверить значимо ли отличаются друг от друга максимальное 13EMBED Unknown1415 и минимальное 13EMBED Unknown1415 из полученных значений по всему плану. Значимость различия двух средних можно проверить также с помощью t(p, f) - критерия (Стьюдента) по формуле:
13EMBED Unknown1415
Средние значимо отличаются друг от друга, если экспериментальное значение критерия 13EMBED Unknown1415 превосходит табличное для числа степеней свободы равной сумме f каждого опыта и критерия значимости 0.05.
Если же статически разница между 13EMBED Unknown1415 и 13EMBED Unknown1415 не значима, то значения параметра оптимизации во всех точках ПФЭ совпадают в пределах ошибки воспроизводимости экcпepимeнтa и дальнейшая обработка, результатов не имеет смысла. В этом случае необходимо расширять интервалы варьирования факторов или уменьшать дисперсию.

5. Получение регрессионной зависимости методом наименьших квадратов (МНК)
В результате, проведения ПФЭ получена система линейных уравнений вида (1), коэффициенты b0 , b1,bk которой необходимо определить. Для этого может быть применен простой и эффективный способ получения оценок коэффициентов регрессии - МНК. Согласно этому методу, коэффициенты должны выбираться так, чтобы минимизировать сумму квадратов разностей между измеренными значениями переменной уi в каждой точке и теми ее значениями, которые предсказаны с помощью модели (1) –13 EMBED Equation.3 1415.13 EMBED Equation.3 1415 Если обозначить сумму как U. то
13EMBED Unknown1415
Согласно методу наименьших квадратов находятся такие значения оценок b0 , b1,bk , которые минимизируют сумму квадратов отклонений U опытных точек от величин, предсказанных регрессионным уравнением.
В планировании эксперимента используется стандартная техника решения таких задач (взятие производных по b0 , b1,.bk, составление системы уравнений и ее решение). Рассмотрим эту процедуру для одного фактора:
13EMBED Unknown1415
Необходимо вычислить 13EMBED Unknown1415 и 13EMBED Unknown1415. Если бы экспериментальные точки строго лежали на линии 13EMBED Unknown1415, то
13EMBED Unknown1415
На практике возникает отклонение экспериментальных точек от теоретической линии - невязка.
13EMBED Unknown1415
Согласно методу наименьших квадратов находятся такие значения оценок 13EMBED Unknown1415,13EMBED Unknown1415, которые минимизируют сумму квадратов отклонений (невязок) опытных точек от величин, предсказанных регрессионным уравнением:
13EMBED Unknown1415
Известно, что минимум, если он существует, достигается при одновременном равенстве нулю частных производных по всем коэффициентам:
13EMBED Unknown1415
.
Тогда указанная процедура в МНК делает определенной любую систему уравнений, то есть число уравнений становится равным числу неизвестных.
13EMBED Unknown1415
Отсюда находим 13EMBED Unknown1415 и 13EMBED Unknown1415.


Root EntryEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation Native

Приложенные файлы

  • doc 18814256
    Размер файла: 117 kB Загрузок: 0

Добавить комментарий