在Design Expert里对响应面进行分析的时候,选择回归模型不能只挑那些看起来显着的,一般情况下,软件会提供Linear、2FI、Quadratic、Cubic这些模型的对比结果,不过这个模型到底能不能拿来用,还需要把模型显着性、失拟项、Adjusted R²、Predicted R²、Adeq Precision还有残差诊断这些指标放在一起看,特别是在碰上失拟项显着这种问题的时候,大家不能为了压低显着性就去盲目提高模型的阶次,应该先去想想是不是模型公式选得不对,或者是实验操作有误差、里面有异常数据、因素范围定得不合适,在Design Expert的Fit Summary里面其实也写了提示,要是失拟项表现出显着,一般就不太建议直接用这个模型去预测响应值了。
一、Design Expert回归模型怎么选择
选回归模型的时候,核心目的就是想找一个能把数据变化解释清楚、同时又不过度拟合的模型,虽然在响应面设计里面经常用到二次模型,但这并不代表每一次做响应,大家都得硬选Quadratic。
1、先看【Fit Summary】中的模型顺序
做完了响应值分析以后,大家可以先把【Fit Summary】这个界面打开,这里面会把Linear、2FI、Quadratic、Cubic这些不同的模型阶次排出来,同时也会把顺序模型检验、失拟检验还有拟合指标给显示出来,大体的看题思路就是:模型得有统计学上的意义,失拟项最好是不显着的,而且几个R²指标之间不能差得太远。
2、再看模型整体是否显著
点进【ANOVA】界面之后,首先要注意的就是Model这一行,要是Model显着,那就说明现在选的这个模型整体上能把响应值的一部分变化给解释出来,在ANOVA表里面,模型还会被拆成A、B、AB、A²这些更具体的项,以此来分别看每一项到底重不重要。
3、检查单项、交互项和平方项
在回归模型里面,主效应一般是用A、B、C来表示的,交互作用是用AB、AC、BC来表示,而曲率项就是A²、B²、C²,做响应面分析的时候平方项挺重要的,因为曲面有没有拐点主要就看它;交互项也挺要紧,它会影响到等高线是不是倾斜的、两个因素之间会不会互相牵制。
二、Design Expert回归模型失拟项显著怎么处理
要是失拟项显着了,那就说明模型预测出来的数值和实际做实验得到的数值之间差得有点大,这种差异已经不能光用重复实验的误差来敷衍过去了,在Design Expert里面,Lack of Fit本质上就是拿残差误差和纯误差去做对比,而纯误差一般都是从那些重复实验点里算出来的。
1、先不要急着删除数据
很多人一看到Lack of Fit显着,第一反应就是要去删掉异常的数据,或者想着直接换一个更高阶的模型,其实这个处理顺序不太稳妥,正确的做法应该是先倒回去看最开始的实验表,仔细查查响应值有没有抄错、单位有没有弄混、小数点有没有点错,或者随机运行的顺序有没有排错。
2、检查重复点和中心点波动
因为失拟检验需要用到纯误差,而纯误差又是跟着重复点走的,要是中心点的重复实验做得特别稳、波动很小,那纯误差就会被算得很小,这时候模型只要有一点点偏差,就很容易被系统判断成失拟显着,反过来的话,要是重复点本身波动就特别大,那模型的显着性也会跟着受到连累。
3、看残差诊断图有没有明显异常
进到【Diagnostics】这个界面以后,需要多注意看残差正态图、残差与预测值图、残差与运行顺序图、实际值与预测值图,还有Cook’s Distance这些用来瞅影响点的诊断图,要是瞅见有那么几个点明显偏得很远,就要去翻翻翻实验记录,看看当时是不是有温度没控住、样品被污染、仪器报错或者是操作慢了等真正的实验原因。
三、失拟项显著后是否还能用模型
失拟项显着了,倒也不一定就意味着整个实验全搞砸了,但它至少说明如果直接把这个模型拿去做预测和优化,心里得打个问号,在Design Expert的相关说明里,一般是希望Lack of Fit不显着的,常见的经验是p值大于0.10会比较理想;要是失拟显着了,模型拿来做预测的价值可就要打折扣了。
1、只做趋势解释时可以谨慎参考
要是模型整体上是显着的、Adeq Precision算出来比较高、Adjusted R²和Predicted R²的差距在能接受的范围内,而且残差图看着也没有特别糟糕的问题,那这个模型作为看趋势的参考还是可以勉强用用的,比方说拿来判断某个因素大体上是正向影响还是负向影响,或者是某两个因素之间有没有交互的苗头。
2、用于优化前最好做验证实验
要是还打算硬着头皮用这个模型去做优化,建议在软件推荐的最优条件附近去亲自动手做几个验证实验,把预测出来的数值和实际称出来的数值对比一下,看看误差在不在能忍受的范围内,要是发现验证点的偏差大得不行,那就说明失拟问题已经把实际预测给耽误了,得重新建模或者倒回去补做实验。
3、必要时回到设计阶段调整因素范围
有时候失拟这个问题,在最后的数据分析阶段是没办法解决的,因为它其实是设计阶段留下的毛病,比如因素的范围定得太宽了,导致响应关系早就不是简单的二次曲面了;或者因素范围给窄了,响应的变化根本就不明显;又或者是某些因素之间本来就互相约束,但设计的时候却把它们当成独立的因素来算了。
总结
在面对Design Expert回归模型怎么选择,或者Design Expert回归模型失拟项显著怎么处理这些问题的时候,重点其实并不是死板地去挑那个P值最小的模型,而是要看模型能不能把数据稳稳当当地解释出来,正常的步骤一般是先看【Fit Summary】,接着看【ANOVA】,然后再去查Adjusted R²、Predicted R²、Adeq Precision和诊断图,要是碰上失拟项显着了,就先去查数据、看重复点、找异常点和残差图,接着再去盘算模型阶次、数据变换或者补做实验,只有等到模型显着了、失拟表现得不明显、预测能力凑合能看,而且实验验证的结果也能说得过去的时候,这个回归模型才比较适合拿来做后面的响应面优化。