Modelling of Chemical Experiment: Kosnos journal

Активен експеримент при две нива на входните фактори

С този материал започнахме една поредица за приложение на хемометриката в химията. В тази лекция ще продължим разглеждането на моделирането на химичния експеримент, което започнахме в предишната лекция.

Идеята на този експеримент може да се подскаже от следните разсъждения. За да се определи влиянието на даден входен фактор върху целевата функция, е необходимо да се проведат два експеримента, единият при една стойност на този фактор, а другият при друга стойност, т.е. два експеримента при две нива на входния фактор - долно ниво и горно ниво. Аналогично влиянието на всеки един от факторите се разкрива по този начин, при което се използват 2^N на брой експеримента, където N е броят на входните параметри. Всъщност за всеки набор на входните фактори е необходимо извършването на няколко опита (наричани повторения или паралели) с цел по-точна оценка на истинската стойност на целевата функция. След усредняване на стойностите на целевите функции от повторенията се получават 2^N независими резултата, от които могат да бъдат изчислени не повече от 2^N коефициента на регресионната зависимост.

Поради тази причина, както и за улеснение при пресмятанията, регресионната зависимост е удобно да се избере от вида

Y = a₀ + Sa_iX_i + Sa_i,jX_iX_j + ... + a_1,2..NX₁X₂...X_N, (7.1)

където X_i, i = 1 .. N, са входните фактори, Y е целевата функция, а коефициентите на регресия a₀, a₁, ... a_1,2..N са 2^N на брой. Например за три фактора, регресионното уравнение ще изглежда по следния начин:

Y = a₀ + a₁X₁ + a₂X₂ + a₃X₃ + a_1,2X₁X₂+ a_1,3X₁X₃ + a_2,3X₂X₃ + a_1,2,3X₁X₂X₃ (7.1a)

Тези данни са достатъчни за всеки математик, който иска да изчисли коефициентите на регресия. От 2^N-те независими резултата, могат да бъдат написани 2^N линейни уравнения с неизвестни a₀, a₁, ... a_1,2..N, с коефициенти пред неизвестните - 1, X₁, ... X₁X₂...X_N и свободни членове - Y (във всяко уравнение Y и X_i приемат конкретните експериментални стойности). Но с цел улеснения при пресмятанията и практическото използване на модела химиците работят по друг начин.

1. Пълен факторен експеримент. За всеки един от входните фактори Х_i се избира интервал на вариране (Х_imax,Х_imin), чиито граници се наричат долно и горно ниво на фактора. Средата на интервала Х_i0= (Х_imax + Х_imin)/2 се нарича основно ниво на съответния фактор. Тъй като входните фактори имат различна размерност и различни интервали на вариране, то големината на коефициентите в (7.1) не може да даде относителното влияние на всеки един от параметрите върху целевата функция. Ето защо следващата стъпка е привеждането на стойностите на входните параметри в безразмерни числа Z_i по формулата:

Z_i = (Х_i - Х_i0)/(Х_imax - Х_i0) (7.2)

Числата Z_i се наричат кодирани стойности на факторите. Ако се заместят стойностите на горно и долно ниво на съответните параметри в (7.2), за кодираната стойност на долно ниво ще се получи -1, а за тази на горно ниво - +1, т.е. Zimin = -1 и Zimax = +1.

Ако математичният модел има два входни параметъра съответното регресионно уравнение, което дава зависимостта на некодираната целева функция от кодираните фактори, е следното:

Y = a₀ + a₁Z₁ + a₂Z₂ + a_1,2Z₁Z₂ (7.3)

Вижда се, че всички коефициенти на регресия са с размерността на целевата функция. Кодираните стойности, при които ще се провеждат 2² = 4 експеримента, ще са следните:

Номер на експеримента	Z₁	Z₂
1	-1	-1
2	-1	+1
3	+1	-1
4	+1	+1

За всеки един от четирите набора на входните параметри се провеждат няколко паралелни измервания на целевата функция (паралели, повторения). Намират се техните средни стойности Y^j, където j е номерът на експеримента. Например за два фактора, ако се провеждат пет повторения са необходими общо 4х5 = 20 измервания на целевата функция.

При три фактора, регресионно уравнение ще се дава с формулата:

Y = a₀ + a₁Z₁ + a₂Z₂ + a₃Z₃ + a_1,2Z₁Z₂ + a_1,3Z₁Z₃ + a_2,3Z₂Z₃ + a_1,2,3Z₁Z₂Z₃ (7.4)

а кодираните стойности, при които ще се провеждат 2³ = 8 експеримента, ще са следните:

Номер на експеримента	Z₁	Z₂	Z₃
1	-1	-1	-1
2	-1	-1	+1
3	-1	+1	-1
4	-1	+1	+1
5	+1	-1	-1
6	+1	-1	+1
7	+1	+1	-1
8	+1	+1	+1

Тази таблица (както и предишната) от кодирани стойности на входните параметри се нарича план-матрица на експеримента. Тя може да се запише по различни начини, но най-удобният е следният: за първия фактор първата половина стойности са -1, а втората половина +1. За втория фактор първата четвърт са -1, втората четвърт +1, третата -1 и последната +1. За третия параметър първата осма са -1, и т.н. За последния фактор кодираните стойности се променят от експеримент на експеримент. Могат да съществуват различни начини на подредбата на кодирането на експериментите, но важно е да няма повторения в набора от входни фактори.

План-матрицата притежава свойства, които се използват за изчисляване на коефициентите на регресия. Тези свойства лесно могат да се проверят чрез използване на стойностите на Z_i от двете таблици по-горе. С Z_i^j се означават кодираните стойности на параметрите, където i е номерът на съответния фактор (номерът на стълба), а j - номерът на експеримента (реда). Сумите по-долу се сумират по j от 1 до K, където K е броят на независимите експерименти: K = 2^N.

1) Сумата от кодираните стойности на всеки един от факторите е нула, т.е. сумата на числата във всеки стълб е равна на нула.

S Z_i^j = 0

2) Сумата от квадратите на числата във всеки стълб е равна на броя на експериментите К; К = 2^N. Причината е, че (Z_i^j)² = 1.

S (Z_i^j)² = К

3) Всеки два стълба са ортогонални, т.е. сумата на произведението на числата на всеки два стълба е нула (символът =/= означава различно).

S Z_i^jZ_k^j = 0, за j =/= k и очевидно (вижте свойство 2) е равно на 1 за j = k;

4) Сумата от взаимното произведение на повече от два стълба е равно на нула, например това на три стълба.

S Z_i^jZ_k^jZ_l^j = 0, за j =/= k =/= l.

Чрез използването на свойства 1) - 4) могат да се получат формулите за оценките на коефициентите на регресията (7.4), които се означават с b₀, b₁, ... b_1,2,..N.

b₀ = S Y^j/K (7.5a)

b_i = S Y^jZ_i^j/K; i = 1 ... N (7.5b)

b_i,k = S Y^jZ_i^jZ_k^j/K; i,k = 1 ... N (7.5c)

Сумира се по номера на експеримента j от 1 до K, където K е броят на независимите експерименти: K = 2^N. С Y^j се означава средната стойност от измерените значения на целевата функция при стойности на входните параметри, дадени в ред номер j.

2. Статистическа обработка на резултатите. Тъй като измерените стойности на целевата функция са случайни величини и следователно случайни величини са и коефициентите (7.5), е необходим статистически анализ, за да се приемат резултатите.

Първо се проверява хипотезата за еднакви възпроизводимости на отделните експерименти, т.е. за еднородност (статистическа неотличимост) на съответните дисперсии. За всеки набор от входни параметри се провеждат няколко измервания на целевата функция, които се характеризират със своето стандартно отклонение. Ако Y_m^j е стойността на целевата функция при m-тото повторение на j-я експеримент и броят на повторенията е M, то средната стойност и стандартното отклонение на целевата функция при тези повторение се изчисляват с формулите (сумира по m се от 1 до M):

`Y^j = S Y_m^j/M (7.6a)

S_j² = S (Y_m^j -`Y^j)²/(M-1) (7.6b)

Оценките на коефициентите на регресия се изчисляват по формули (7.5), само ако между всички S_j няма статистическа разлика, т.е. възпроизводимостите на различните експерименти са еднакви. При еднакъв брой паралели M във всички експерименти хипотезата за равенство между S_j може да се провери с критерия на Фишер. За тази цел се изчислява отношението

F_kr = S_max²/S_min²,

където S_max е най-голямото стандартно отклонение, а S_min най-малкото от всички S_j. Избира се ниво на значимост a и от таблица на интегралните граници на F-разпределението за степените свобода f₁ = M - 1 и f₂ = M - 1 се намират интегралните граници F(f₁,f₂, a) = F(f₂,f₁, a) - в случая те са едни и същи, защото f₁ = f₂. При 1/F(f₂,f₁, a) < F_кр < F(f₁,f₂, a), възпроизводимостите на всички експерименти са еднакви. Ако не са изпълнени двете неравенства, възпроизводимостите не са еднакви. В този случай е необходимо провеждането на част от експериментите, за да се провери дали тази разлика във възпроизводимостите не се дължи на груби експериментални грешки или е физически присъща на съответните експерименти. Проверката за еднородност на дисперсиите на отделните експерименти може да се извърши с критерия на Кохрън или с критерия на Бартлет.

Следва проверката за статистическата значимост (статистическото отличие от нула) на регресионните коефициенти. За тази цел се извършва тяхното интервално оценяване, чрез теста на Стюдънт. Ако нулата принадлежи на даден оценяващ интервал, то съответният регресионен коефициент е статистически неотличим от нула и той се приема за равен на нула в уравнението (7.3), съответно (7.4). В противен случай той е статистически значим и в уравнение (7.3), съответно (7.4) присъства неговата експериментална стойност.

Когато броят на повторенията на всички експерименти са равни помежду си и съответните им възпроизводимости са еднакви, интервалната оценка на коефициентите a_i (съответно a_i,k и a_1,2,3) се дава с уравнението

(7.7)

където t(f, a) е интегралната граница на t-разпределението при ниво на значимост a и степени свободаf = К(M - 1); К е броят на експериментите, M е броят на повторенията на всеки един експеримент, а К' = КM е броят на всички опити. Стандартното отклонение S е оценка за дисперсията на отделните експерименти (само при еднаквата им възпроизводимост) и е равно на:

(7.8)

Тъй като във всички формули (7.5) присъстват членовете Y^j в числителя и N в знаменателя, а изразите от вида Z_i или Z_iZ_k или Z_iZ_kZ_l са равни на +1 или -1 и като се имат предвид свойствата на дисперсията, интервалната оценка (7.7) се отнася за всички коефициенти на регресия - a_i, a_i,l и a_1,2,3 и т.н.

Адекватността на модела (7.4) се проверява с критерия на Фишер. За тази цел се изчислява стандартното отклонение (на адекватност) S_ad, което е равно на:

където `Y^j е средната стойност на целевата функция от всичките повторения на даден експеримент, а Y^j е стойността на целевата функция, която се получава при заместване на кодираните стойности Z_i^j, j = 1 ... 2^N, на входните фактори в уравнението на регресия. L е броят на статистически значимите коефициенти на регресия. Изчислява се критерия F_кр по формулата:

F_кр = S_ad²/S²,

където S е стандартното отклонение (7.8) на експериментите. За степени свобода f_ad= K - L - 1 и f = К(M - 1) и избрано ниво на значимост a се намира интегралната граница F(f_ad, f, a) на F-разпределението. Ако F_кр< F(f_ad, f, a), моделът е адекватен, а при F_кр> F(f_ad, f, a) е неадекватен.

^{(съдържание)}

Литература

1. Футеков Л., Пенчев П., "Теория на експеримента", Пловдив, Изд. ПУ, 1992, 1998.

Автор: Пламен Пенчев, Ph.D.

[ това е материал от брой 27 от февруари 2009 г. на списание "Коснос" www.kosnos.com ]