很多人第一次用Design Expert做因子设计,会发现表里同一组实验点在不同列里“顺序不一样”,看上去像软件把实验顺序排乱了。多数情况下这不是偏差,而是把建模用的标准顺序和现场执行用的运行顺序分开呈现;真正需要警惕的是没有随机化、随机化被人为破坏,或批次因素没有用区组隔离,最终把时间漂移与因子效应混在一起。
一、实验顺序看起来有偏差的常见原因
1、Std Order与Run Order本来就不是一回事
Std Order更多用于设计结构与模型识别,顺序通常是固定排列;Run Order才是建议的执行顺序,只要启用了随机化就会被打散,因此“看起来不连贯”反而说明随机化在工作。
2、中心点与重复点插入位置不同会让顺序更不整齐
中心点与重复点常被分散到运行序列中,用来估计纯误差与捕捉漂移,如果把它们集中到某一段,反而容易让模型对漂移更敏感。
3、你在表格里排序过,顺序就被你自己改了
很多时候并不是软件生成有问题,而是查看时按某个因子列、响应列或Std Order列做了排序,Run Order自然就不再按执行顺序展示;导出执行清单时应以Run Order作为唯一排序依据。
4、受限随机化没设置,导致“能随机的没随机,不能随机的被打乱”
例如温度或设备模式切换成本高,需要分批做,如果直接全随机,现场会被迫人工插队,插队一多就引入新的偏倚;这类场景应通过区组或分批约束,让“必须连续的连续、其余部分随机”。
5、现场执行顺序与Run Order不一致但录数时按原表硬填
现场因为停机、复测、材料不足等原因临时调整顺序很常见,问题在于后续录数仍按原Run Order行号填,导致“数据对应错行”,看上去像顺序偏差,其实是对账失败。
6、批次因素与因子水平共线,顺序偏倚被放大
如果某一天只做高水平、另一天只做低水平,批次差异就会与因子效应混淆,模型会把批次漂移误判成因子影响,这类结果往往表现为主效应异常大或交互方向反直觉。
二、Design Expert随机化与区组应如何配置
1、创建设计时先把随机化开关打开
点击【File】→【New Design】进入向导,完成因子类型与水平设置后,找到Randomize相关选项,勾选【Randomize Runs】再生成设计,避免后续再手工打乱造成记录混乱。
2、生成后立刻在设计表里核对Run Order是否已打散
进入【Design】→【Design Layout】,检查Run Order列是否与Std Order明显不同;如果两列完全一致,优先回到生成向导确认随机化是否未勾选,或是否被设置为固定顺序。
3、需要按天或按批次做时优先用区组锁住批次因素
在生成设计的选项页或设计设置里找到Blocks相关设置,按现实约束设置区组数量,例如两天做完就设2个区组;生成后表格会出现Block列,后续分析会把Block作为补偿项吸收批次差异。
4、坚持区组内随机化,区组间按现场约束执行
如果必须按Block 1先做、Block 2后做,仍建议在每个Block内部保持随机化,避免区组内部出现因子水平递增的顺序偏倚;检查选项中是否存在类似【Randomize within blocks】的设置并启用。
5、遇到难变更因子时,不要硬做全随机
例如温度、压力档位、炉温曲线这类难频繁切换的条件,建议把它作为区组依据或批次依据处理,让该因子在同一批次内尽量稳定,再对其他易变因子做充分随机化,现场更容易按表执行。
6、给随机化留一个可复现的口径,方便回归与复盘
如果团队需要复现实验顺序,建议在项目记录里保存当次设计文件与导出的运行表,同时把Run Order版本号或导出时间写进实验记录,避免后续重新随机化后出现两个不同的“同名设计顺序”。
三、执行与分析时的顺序对账与纠偏
1、导出执行清单只按Run Order排序,并把Block一起打印出来
执行前导出运行表,至少包含Run Order、Block、所有因子水平、响应填写列与备注列;现场只允许填响应与备注,不建议改动行顺序与因子水平。
2、现场如有插队或复测,必须在备注里记录实际执行序号
建议新增一列记录实际执行顺序,例如Actual Run,发生复测时再记录Repeat原因与替换关系,这样后续分析时能判断异常来自过程漂移还是数据对错行。
3、分析前先做一次完整性检查,避免空洞与错行
在【Design Layout】里检查每个Run Order是否都有响应值,是否存在某一行漏填或把两条数据填到同一行;若发现错行,优先按现场记录纠正数据位置,再进入模型拟合。
4、把残差对Run Order的趋势当作漂移探测器
完成拟合后查看残差随Run Order变化是否呈现单调上升或下降,若有明显趋势,说明仍存在时间漂移未被吸收,应考虑增加区组、增加中心点或把关键批次因素纳入Block,而不是直接加高阶项硬拟合。
5、区组项进入模型后效果“变小”是正常现象
引入Block后,因子效应往往更接近真实,因为批次差异被区组吸收;若引入区组后模型更稳定、诊断图更干净,应优先接受这种变化,而不是回退到无区组的结果。
6、把随机化与区组做成固定模板,下一次只改范围不改流程
同一条产线或同一类实验,建议固定区组规则,例如按班次、按批次、按设备编号,并固定区组内随机化方式;这样顺序偏倚的风险会持续下降,数据也更可比。
总结
Design Expert生成的实验顺序看似有偏差,多数是Std Order与Run Order分工不同造成的正常呈现;真正的风险来自未随机化、现场破坏随机化,以及批次因素未用区组隔离。按生成阶段启用随机化、按现实约束设置区组并保持区组内随机化,再配合执行清单与实际顺序对账记录,顺序偏倚通常都能在实验前就被控制住。