正交实验法及其应用
为了研制新产品,提高产品的质量和数量,降低原材料消耗,都需要做试验。一项试验如何安排,就得选择方法。一个好的试验方法,只要用少量试验既能得到较好的效果和分析出较为正确的结论;如果试验方法不好,不但试验次数多,而且结果还不一定理想。正交试验法就是利用一套规格化的表(正交表)来安排试验方案,使得试验次数尽可能地少;并通过对试验数据的简单分析,有助于我们在复杂的影响因素中抓住主要因素,从而找出较好的实验方案。“正交试验法”应用的范围非常广泛,现已成为比较简便、易行的一种应用数学方法。这里分两部分:简单介绍正交试验的基本方法和利用该方法对芦荟多糖提取条件进行优化。其中第一部分包括:正交试验法解决的问题;涉及的相关术语;如何用正交表安排试验以及怎样分析试验结果。另外,有时试验过程中不仅因素的水平变化对指标有影响,而且,有些因素间各水平的联合搭配对指标也产生影响,这种联合搭配作用称为交互作用,这里不作介绍。第二部分应用正交实验法对芦荟多糖提取条件进行了优化,得到很好的试验结果,大大加快了试验的进程,并节约了试验的耗材。
第一部分正交试验的基本方法
一、 什么是“正交试验法”
采用什么样的实验设计方案能够做到优质、高产、低稍耗?要使实验顺利进行应该改进哪些实验条件……?由于实验结果是受许多方面的因素的影响,往往需要进行试验来增加对具体实验的认识,以便摸索其中的规律性。
凡是要做试验就存在着如何安排试验和如何分析试验结果的问题。科学的实验安排应能做到两点:1)在试验安排上尽可能地减少试验次数 2)在进行较少次数试验的基础上,能够利用所得到的试验数据,分析出指导下一步实验的正确结论,并得到较好的结果。
“正交试验法”就是一种科学地安排与分析多因素试验的方法。下面通过一个例子初步说明一下它是解决什么问题的。
例. 研究人参皂苷的提取工艺试验。
根据经验,乙醇用量、乙醇浓度、提取时间、回流次数等对人参皂苷的提取有显著影响。所以在提取过程中需要考察乙醇用量(A)、乙醇浓度 (B)、回流时间 (C)、回流次数 (D)这四个因素。每个因素比较三种不同的条件(见表)
试验考察因素
试验比较条件
乙醇用量(A单位:倍)
4
5
6
乙醇浓度(B单位:%)
60
65
70
回流时间(C单位:min)
30
45
60
回流次数(D单位:次)
4
6
8
类似这样的问题,在实验中经常遇到。这类问题称之为多因素试验问题。“正交试验法”正是解决这类问题的行之有效的一种方法。
为了叙述的方便,下面介绍一下涉及到的术语和符号。一般,把试验需要考察的结果称为指标。如产品的性能、质量、成本、产量等均可做为衡量试验效果的指标。本例中的人参皂苷的量就是试验的指标。把在试验中要考察的对试验指标可能有影响的因素简称为因素。本例中的乙醇用量(A)、乙醇浓度 (B)、回流时间 (C)、回流次数 (D)就是四个因素。把每个因素在试验中要比较的具体条件称为水平。如4、5、6就是乙醇用量这个因素的三个水平,60、65、70就是乙醇浓度这个因素的三个水平。
例1中共有四个因素,每个因素都是三个水平,称之为三水平四因素试验,简记为34型试验。为了书写方便,我们引入了一些符号。通常用大写字母A、B、C、D等代表因素。用在字母右下方加足标1、2、……等表示因素的不同水平,本例中A1,表示A因素取“1”水平.即取4,B2表示B因素取“2”水平,即取65,……。这样,我们可以把例1中的因素水平写成:A1=4;A2=5;A3=6。在选定了因素、水平之后,很自然地要考虑试验怎样进行的问题。在我们所举的例题中共有四个三水平的因素,各因素所取的水平之间全部可能的搭配有3x 3x 3x 3=34=81种。当然,我们如把各因素所取水平间全部可能搭配的全面试验作完,就可以选出其中最好的试验条件。但是,每次都做全面试验不仅是不必要的,而且当因素、水平取得较多时,往往也是不可能做到的。因此,我们希望只选做其中的一部分试验,就能相当好地反映全面试验可能出现的各种情况,以便从中选出较好方案。
那么,究竟选则哪一部分试验才能反映全面的情况呢?显然,随手拈来几个试验是不可能满足上述要求的。“正交试验法”就能够帮助我们选择一部分有代表性的试验方案,并给出了科学地分析试验结果的方法。
利用“正交试验法”可以解决多因素、多水平及多指标这一类的试验问题。采用“正交试验法”虽然试验次数比较少,但同样能够明确回答下面的几个问题:
因素的主次。如例1中所考察的四个因素中哪个是影响产量的主要因素,哪个是比较次要的,哪些是影响很小的。
2 因索与指标的关系。如例1中每个因紊各取不同水平时产量是怎样变化的。
3 什么是较好的生产条件。也就是例l中所考察的四个因素各取什么水平能获得较满意的产量。
4 进一步试验的方向。
因素水平确定之后,全面试验的次数可由各因素水平数的乘积算得。如本例中有三水平因素四个,所以全面试验的次数为3x 3x 3x 3=81。如另一试验为二水平五因素试验那么全面试验的次数应为2×2x 2x 2x 2=32。
二、用正交法安排试验
前面介绍了“正交试验法是解决什么样问题的。“正交试验法”是用正交表安排试验的。这部分叙述如何用正交表安排试验。
根据试验的目的,确定了试验指标,例1中指标为人深皂苷产量,又分析了可能影响指标的因素,选取了各因素的水平.于是可以列出因素水平表。例1的因素水平表(见表1—1)如下。
在确定了因素、水平之后,就要选一张合适的正交表来安排试验方案。为此,先介绍一下正交表。表l—2是一张正交表,记为L9(34)。其符号和数字的意义是
除了L9(34)之外,还有一些常用的正交表,如,二水平表有L4(23)、L8(27)、L16(215),三水平表还有L27(318),……等(可见有关书中的附录),其中的符号和数字的含义与L9(34)
类似。
例1是一个三水平试验,应该从三水平表L9(34)、L27(318)中选一张比较合适的表。例1中只有四个因素,这两张表都至少有四个列。因此都可用来安排这个试验。选
用它们则分别要做9次、27砍试验。我们要求尽量少做试验,L9(34)表正好可以安排四个因素,所以就选用这张表。
怎样用它来安排试验呢?具体做法很方便,只要把A、B、C、D四个因素分别填在表中的1、2、3、4列的上方就行了。这叫做排表头。一按说来,一列只排一个因素,不要排两个,就是说不要“混杂”,至于哪一个因素排在四一列上是可以任意的。但是,表头一旦排定,试验方案也就由正交表完全确定了。表l—3给出了例1中四个因素的一种排法。
把表1—3中各列的数字“l”、“2”、“3”分别看作所填因素在各号试验中的水平,就可以写出这个方案所要做的九次试验的具体条件了。例如,第一行就是第一号试验.A
因素下面表中的数字为“1”(见表I-4),就是说A因素应取“1”水平A1。其它因素下面表中的数字均为“1”,就是说共余因素也应取“l”水平B1C1D1。所以第一号试验的条件就是A1B1C1D1。
同样,可以写出其余各号试验的条件。我们将这九次试验的条件分别写出是:
我们把翻译好的试验条件列成试验方案表(见表1—5)。
表1-5 试验方案表
因素
试验号
乙醇用量
(A单位:倍)
乙醇浓度
(B单位:%)
回流时间
(C单位:min)
回流次数
(D单位:次)
1
4
60
30
4
2
4
65
45
6
3
4
70
60
8
4
5
60
45
8
5
5
65
60
4
6
5
70
30
6
7
6
60
60
6
8
6
65
30
8
9
6
70
45
4
从表1—3决定的试验方案可以看出,用正交表安排试验有下述两个特点:
(1)每个因素的各个不同水平在试验中出现了相同的次数。
例如A因素的“1”水平出现在第1、2、3号试验中,“2”水平出现在第4、5、6号试验中,“3”水平出现在第7、8、9号试验中,每个水平各出现三次。又如C因素的“1”水平出现在第1、6、8号试验中,“2”水平出现在第2、 4、9号试验中,“3”水乎出现在第3、5、7号试验中,每个水平各出现三次。其它因素也是一样。
(2)任何两个因素的各种不同水平的搭配,在试验中都出现了,并且出现了相同的次数。
例如A与B两个因素的不同水平的全部搭配A1B1、A1B2、AlB3、A2B1、A2B2 、A2B3、A3B1、A3B2、A3B3,分别出现在第1至第9号试验里,每种搭配只出现一次。同样,B与D两个因素的不同水平的全部搭配B1D1、B1D2、B1D3,B2D1、B2D2,B2D3、B3D2、B3D3,分别出现在第1、7、4、5、2、8、9、6、3号试验中,每种搭配只出现一次。表中的任何两个因素均满足。
由于上述特点,“正交试验法”安排的试验方案是有代表性的,能够比较全面地反映各因素各水平对指标影响的大致情况。因此,用“正交试验法”安排试验就能够减少试验次数。
根据试验的目的、要求确定指标、因素和水平后,选择合适的正交表排表头,写出试验方案表,以上是整个试验的第一阶段叫做安排试验。
三、用正交表分析试验结果一极差分析
根据表1—5排好的试验方案,按各号试验规定的试验条件,进行了人参皂苷的提取工艺试验,并把收口后的组合件进行拉脱试验后,得到了九个拉脱力数据。将它们填入jI(34)表右侧数据拦内(见表l—6)。现在,我们从九个试验数据出发,利用正交表来分析试验结果。
表l—6
首先分析因素A。因素A排在第1例,所以,要从第1列来分析。如果把包含A因素“1”水平的三次试验(第1、2、3号试验)算做第一组,同样,把包含A因素“2”水平、“3”水平的各三次试验(第4、5、6号及第7、8、9号试验)分别算第二组、第三组。那么,九次试验就分成了三组。在这三组试验中,各因素的水平出现的情况见表1—7,
由表1—7可以看出,在Al、A 2、A3各自所在的那组试验中,其它因素(B、C、D)的1、2、3水平部分别出现了一次。
把第一组试验得到的试验数据相加,即将第一列l水平所对应的第1、2、3号试验数据相加(见表l—6),其和记作I。
I=3.27+4.14+4.30=11.71
把第二组试验得到的数据相加,即将第一列2水平所对应的第4、5、6号试验数据相加,其和记作II。
II=4.36十4.29十4.39=13.04
同样,将第一列3水平所对应的第7、8、9号试验数据相加,其和记作III。
III=5.15十5.22十5.52=15.89
于是、就可以将I看作是这样三次试验的数据和,即在这三次试验中,只有A1水平出现三次,而B、C、D三个因素的l、2、3水平各出现一次(见表1—7),数据和I反映了三次A1水平的影响,和B、C、D每个因素的1、2、3水平各一次的影响。同样,II(III)反映了三次A2(A3)水平及B、C、D每个因素的三个水平各一次的影响。
比较I、II、III的大小时,可以认为B、C、D对I、II、III的影响大体相同的。因此,可以把I、II、III之间的差异看作是由于A取了三个不同的水平而引起的。用同样的方法分析因素B。B因素排在第2列,所以要从第2列来分析。把包含B1水平的第1、4、7号试验数据相加记作I,把包含B2水平的第2、5、8号试验数据相加记作II。把包含B3水平的第3、6、9号试验数据相加记作III。计算结果如下:
I=3.27+4.36+5.15=12.78
II=4.14+4.29+5.22=13.65
III=4.30+4.39+5.52=14.21
同样,在B因素取某一水平的三次试验中,其它A、C、D的三个水平也是各出现一次。所以,按第二列计算的I、II、III之间的差异同样是由于B取了三个不同的水平而引起的。
按照这个方法,我们便可把各因素的I、II、III计算出来。总之,按正交表各列计算的I、 II、III数值的差异,就反映了各列所排因素取了不同水平对指标的影响。
在计算完各列的I、II、III之后,还要把每一列的I、II、III中最大值和最小值之差算出来,我们把这个差值叫作极差,记作R。这样,使可算出这四列(即四个因素)的极
差,结果如下:
第一列(A因素) R=15.89-11.71=4.18;
第二列(B因素) R=14.21-12.78=1.43;
第三列(C因素) R=14.02-12.88=1.14;
第四列(D因素) R=13.88-13.08=0.8。
每一列算出的极差大小、反映了该列所排因素选取的水平变动对指标影响的大小。
至此,计算了各列的I、 II、IIII及R,并把这些结果填入表1—6的相应位置上。这样,就完成了试验数据的计算这一步。
根据这些计算结果.就可以回答在第一节末尾提出的四个问题。
1)各因素对指标的影响谁主谁次呢?
根据极差R这一栏的数据可知,第1列A较大,第四列D最小。这反映了因素A水平变动时,指标波动最大,因素D的水平变动时,指标波动很小。由此可根据极差的大小顺序排出因素的主次顺序:
主———一次
A; B、 C; D
(这里,R值相近的因素用“、”号隔开,而R值相差较大的因素用“;”号隔开;另外,还可以用图形直观地描述这些关系。)。
2)各因素取什么水平好呢?
选取因素的水平是与要求的指标有关的。要求的指标越大越好,应该取使指标增大的水平,即各因素I、II、III中最大的那个水平。反之,加要求的指标越小越好,则取其中最小的那个水平。例1的试验目的是提高产量,所以应该挑选每个因素I、II、III中最大的那个水平,即A3、B3、C2、D3。(也可从所作的图上挑出各因素图形中最高点的水平得到。)
3)什么是较好的生产条件?
各因素的好水平加在一起,是否就是较优生产条件?从I、 II、III的计算可以看出,各因素选取的水平变动时,指标被动的大小,实际上是不受其它因素的水平变动影响的。
所以,把各因素的好水平简单地组合起来就是较好生产条件。但是,实际上选取较好生产条件时,还要考虑因素的主次,以便在同样满足指标要求的情况下,对于一些比较次要的因素按照优质、高产、低消耗的原则选取水平,得到更为结合生产实际要求的较好生产条件。
对于主要因素,一定要按有利于指标的要求选取水平(即取计算结果选出的好水平)。而次要因素可同时考虑其它指标。例l中对于次要因素D,就可根据其它方面的要求选取水平。最后决定选D2。较优生产条件是:A3B3C2D2即:最佳提取工艺为药材加6倍量70%乙醇 ,提取6次 ,每次45min。
需要指出的是,例1中得到的较好生产条件,恰恰不包括在已做过的九次试验中。这是由于使用正交表安排的九个试验是有代表性的,能够比较全面地反映四个因素各个水平对产量的影响,在对试验数据进行了计算分析后,再从较好的搭配中挑出更好的生产条件,这样就不会漏掉。
4)各因素的水平变化时,指标的变化规律怎祥呢?
从数据或图中分析可以看出,因素A、B、D随着值的增加产量是逐渐提高的。
其中,A、B增加较显著,因此在进一步作试验还有希望进一步提高;而D的影响到D3时已经不够明显,且增加了试验的烦琐和耗材。因此,通过计算分析为进一步试验指明了方向。
第二部分正交试验法用于芦荟多糖提取
前言
传统方法提取芦荟多糖工艺流程是:原料清洗 去皮称重 打浆 按比例加水 加热浸提 抽滤 清液保留 残渣再提取,合并提取液浓缩 除蛋白 加95%乙醇沉淀 复溶后再加乙醇沉淀,反复三次 无水乙醇洗涤沉淀多糖 低温真空干燥得芦荟粗多糖。
二.列出试验方案表、做试验实验结果进行分析
影响芦荟多糖提取率的因素很多,本试验采用四因素三水平正交实验确定提取工艺参数,因素水平表见表1-8。根据因素水平表分组实验,每组取去皮鲜芦荟叶500g提取多糖,时间0.5h,结果见表1-9。
表1-8
表1-9
三.实验结果分析
从极差结果得出影响多糖提取率的回素主次顺序为B>D>A>C,影响较大的为B、D、A,即温度、醇沉浓度和 pH值,液料比的影响不显著,这可能与原料中水分含量较大有关。最佳组合为A3B3C3D3,考虑到减少浓缩步骤的工作量,取A3B3C1D3,按此条件做实验,得粗多糖0.74199g.
总之,正交试验法广泛应用于工农业生产及科学实验中,它的主要依据是数学上称为“正交表”的一类表的特性质。它本身不能取代试验,但它的主要功能和优点就是能在众多的较为复杂的实验条件中选取出代表性强且少量的条件,通过这些条件能得到较好的试验的结果,从而获得较优的方案。本例通过将正交试验法应用于对芦荟多糖提取工艺的优化,从而用最优的条件得到尽可能多的产品。目前,正交试验法作为一种设计试验的工具,已有相应的软件,这更加提高了科研工作者的工作效率,显示出其在多因素试验安排中无可比拟的优越性。