正交试验设计:一种高效的多因素实验方法
正交试验设计:一种高效的多因素实验方法
正交试验设计是一种研究多因素多水平的实验设计方法,它通过挑选部分有代表性的实验点,实现"均匀分散,齐整可比"的特点。这种方法不仅大大减少了实验次数,还提高了实验效率和经济性。
基本信息
- 中文名:正交试验设计
- 外文名:Orthogonal experimental design
- 研究内容:多因素多水平的实验设计方法
- 特点:均匀分散,齐整可比
- 优点:高效率、快速、经济
- 创始人:田口玄一
概述
日本著名统计学家田口玄一将正交试验选择的水平组合列成表格,称为正交表。例如,进行一个三因素三水平的实验,全面实验需要进行3^3 = 27种组合,而使用L9(3)正交表只需进行9次实验,L18(3)正交表进行18次实验,大大减少了工作量。
正交表用L表示,n表示试验次数,t表示水平数,c表示列数,即可能安排最多的因素个数。例如L9(3^4)表示需作9次实验,最多可观察4个因素,每个因素均为3水平。混合型正交表如L8(4×2),其中1列为4水平,4列为2水平。
正交表的性质
- 每列中不同数字出现次数相等。例如,在两水平正交表中,数码"1"与"2"出现次数相等;在三水平正交表中,"1"、"2"、"3"出现次数相等。
- 任意两列中数字排列方式齐全且均衡。例如,在两水平正交表中,有序对子(1,1)、(1,2)、(2,1)、(2,2)出现次数相等;在三水平情况下,有序对1.1、1.2、1.3、2.1、2.2、2.3、3.1、3.2、3.3出现次数也相等。
这两点体现了正交表的"均匀分散性,整齐可比"的优越性。每个因素的每个水平与其他因素各水平各碰一次,这就是正交性。正交表的获得有专门算法,应用者不必深究。
实验安排
正交试验设计的关键在于试验因素的安排。在不考虑交互作用的情况下,可以自由地将各个因素安排在正交表的各列,只要不在同一列安排两个因素即可。但是当要考虑交互作用时,就会受到一定的限制,如果任意安排,将会导致交互效应与其它效应混杂的情况。
因素所在列是随意的,但是一旦安排完成,试验方案即确定,之后的试验以及后续分析将根据这一安排进行,不能再改变。对于部分表,如L18(2*3^7)则没有交互作用列,如果需要考虑交互作用需要选择其它的正交表。
极差分析
在完成试验收集完数据后,将要进行的是极差分析(也称方差分析)。极差分析就是在考虑A因素时,认为其它因素对结果的影响是均衡的,从而认为,A因素各水平的差异是由于A因素本身引起的。
用极差法分析正交试验结果应引出以下几个结论:
- 在试验范围内,各列对试验指标的影响从大到小的排队。某列的极差最大,表示该列的数值在试验范围内变化时,使试验指标数值的变化最大。所以各列对试验指标的影响从大到小的排队,就是各列极差D的数值从大到小的排队。
- 试验指标随各因素的变化趋势。
- 使试验指标最好的适宜的操作条件(适宜的因素水平搭配)。
- 对所得结论和进一步研究方向的讨论。
条件选择
各因素的好水平加在一起,是否就是较优试验条件呢?理论上,如果各因素都不受其它因素的水平变动影响的,那么,把各因素的优水平简单地组合起来就是较好试验条件。但是,实际上选取较好生产条件时,还要考虑因素的主次,以便在同样满足指标要求的情况下,对于一些比较次要的因素按照优质、高产、低消耗的原则选取水平,得到更为结合试验和实际要求的较好生产条件。
以上介绍如何分析各因素水平的变动对指标的影响。讨论A因素时,不管其它因素处在什么水平,只从A的极差就可判断它所起作用的大小。对其它因素也作同样的分析,在此基础上选取各因素的较优水平。
实践中发现,有时不仅因素的水平变化对指标有影响,而且,有些因素间各水平的联合搭配对指标也产生影响,这种联合搭配作用称为交互作用。而交互作用应该在试验设计时考虑到。
分析方法
- 直接对比法:直接对比法就是对试验结果进行简单的直接对比。直接对比法虽然对试验结果给出了一定的说明,但是这个说明是定性的,而且不能肯定地告诉我们最佳的成分组合。显然这种分析方法虽然简单,但是不能令人满意。
- 直观分析法:直观分析法是通过对每一因素的平均极差来分析问题。所谓极差就是平均效果中最大值和最小值的差。有了极差,就可以找到影响指标的主要因素,并可以帮助我们找到最佳因素水平组合。
基本思想
考虑进行一个三因素、每个因素有三个水平的试验。如果作全面试验,需作3^3 = 27次。
图:正交试验设计示意图
若从27次试验中选取一部分试验,常将A和B分别固定在A1和B1水平上,与C的三个水平进行搭配,A1B1C1,A1B1C2,A1B1C3。作完这3次试验后,若A1B1C3最优,则取定C3这个水平,让A1和C3固定,再分别与B因素的三个水平搭配,A1B2C3,A1B3C3。这2次试验作完以后,若A1B2C3最优,取定B2,C3这两个水平,再作两次试验A2B2C3,A3B2C3,然后与一起比较,若A3B2C3最优,则可断言A3B2C3是我们欲选取的最佳水平组合。这样仅作了7次试验就选出了最佳水平组合。
我们发现,这些试验结果都分布在立方体的一角,代表性较差,所以按上述方法选出的试验水平组合并不是真正的最佳组合。
如果进行正交试验设计,利用正交表安排试验,对于三因素三水平的试验来说,需要作9次试验,用"Δ"表示,标在图中。如果每个平面都表示一个水平,共有九个平面,可以看到每个平面上都有三个"Δ"点,立方体的每条直线上都有一个"Δ"点,并且这些"Δ"点是均衡地分布着,因此这9次试验的代表性很强,能较全面地反映出全面试验的结果,这就是正交实验设计所特有的均衡分散性。我们正是利用这一特性来合理的设计和安排试验,以便通过尽可能少的试验次数,找出最佳水平组合。
设计过程
- 确定试验因素及水平数;
- 选用合适的正交表;
- 列出试验方案及试验结果;
- 对正交试验设计结果进行分析,包括极差分析和方差分析;
- 确定最优或较优因素水平组合。
联系
- 正交试验设计法是遗传算法的一种特例,即正交试验设计法是一种初始种群固定的、只使用定向变异算子的、只进化一代的遗传算法。
- 遗传算法的步骤比正交试验设计法复杂,所需的试验次数也要多于正交试验设计法的试验次数,但它产生的解要优于正交试验设计法产生的解。
- 遗传算法的隐并行性使得它在处理交互作用项时,效率比正交试验设计法要高。
- 正交试验设计法可解决一般遗传算法中的最小欺骗问题。
案例分析
水稻播种机穴盘育秧播种装置
随着栽培技术的不断更新,高效、节本、高产的抛秧栽培法获得了迅速发展和推广。为了改善原有播种装置中窝眼辊轮结构,我们研制成功了穴盘育秧播种装置,它不仅解决了手工操作进行育秧培育的劳动强度大,工作效率低等问题,而且能大幅度地提高播种量的稳定性和播种的均匀性,使水稻播种机械更趋实用与完善。
试验目的:考虑影响播种性能的主要因素对水稻播种机穴盘育秧播种装置播种性能的影响程度,以达到优化设计参数。
试验条件:
- 种子品种:杂交稻(协优46号)
- 种子状况:经过脱芒、浸种、催芽露白、去杂质
- 秧盘规格:600mm×340mm,561穴
- 种子千粒重:26.9g
- 试验盘数:100盘
- 秧盘运行速度与排种胶带线速度严格一致
- 试验因素:选用三个可变因素:生产率(盘/小时)、播种量(粒/穴)、投种高度(mm)。
为了研究生产率、播种量及投种高度对播种性能的影响,特安排了三因素三水平的正交试验,试验因素与水平见下表所示。
正交试验方案与试验结果分析
选用L9(34)正交表进行试验设计,试验方案与试验结果见下表所示。其数据采集方法为:在每种工况(每个试验号)条件下进行随机抽样3盘测定,测定播种合格率时,每盘随机连片抽样100穴。最后,把3次测定的各项数据的平均值记入试验结果。
由上面两表得出影响3项指标的主次因素和较优水平为:播种合格率C1A1B3;播种变异系数C1B3A1;空穴率C1B3A2。
考虑到水稻播种的实际需要,经综合分析,选取各试验因素的较优水平组合为:A1B3C1、A2B3C1、A1B3C1。因为在上述正交试验中未出现过A1B3C1以及A2B3C1,为此专门安排了单因素(生产量)三水平试验,试验结果见下表所示。
从上表可知,最佳组合为A2B3C1,播种合格率96.0%,播种变异系数1.9%,空穴率0.5%。
试验结论
- 400盘/小时是该播种装置杂交稻播种的临界生产率,高出此值,则各项性能指标受重大影响。
- 播种量越大,各项性能指标越好。
- 投种高度对播种质量的影响十分显著,投种高度越低,播种质量越好。