Design Expert中文网站 > 最新资讯 > Design Expert回归模型怎么做变量变换 Design Expert Box Cox怎么用
教程中心分类
Design Expert回归模型怎么做变量变换 Design Expert Box Cox怎么用
发布时间:2026/03/26 14:00:16

  做回归分析时,很多人一看到拟合结果不顺,就先去删点或者改模型项,结果越改越乱。实际上,Design Expert里不少问题并不是模型不会算,而是响应值本身不太满足残差正态和方差稳定这两个前提,所以这时先看变量变换,往往比急着换模型更稳。官方文档也把变换放在分析阶段里,默认状态是【None】,只有诊断图看起来不对时,才建议回头尝试平方根、对数、倒数这类变换。

  一、Design Expert回归模型怎么做变量变换

 

  变量变换这一步,重点不是随便挑一种形式去试,而是先看当前响应是不是确实需要调整尺度。顺序做对了,后面Box Cox的判断才不会跑偏。

 

  1、先把模型正常分析一遍

 

  先进入响应分析界面,照常完成建模和【ANOVA】分析,不要一开始就改变换。因为官方说明里写得很清楚,变换的前提是先检查诊断图,看看残差是否接近正态、方差是否大致稳定,如果诊断图本身没有明显问题,就不必强行做变换。

 

  2、到【Diagnostics】里先看残差表现

 

  建模完成后,切到【Diagnostics】看几张常用图,尤其要留意正态残差图、预测值和实际值的贴合情况,以及残差随运行顺序是否有明显趋势。官方对这些图的解释很直接,残差如果散得没有规律、点位贴近应有趋势,说明模型基础还算正常;要是明显歪斜、漏斗状或者成片偏离,再考虑变换更合适。

 

  3、回到变换设置把【None】改掉

 

  确认需要变换后,再回到分析配置里的变换区域,把默认的【None】改成合适的形式。官方列出的常用选项包括【Square Root】、【Natural Log】、【Base 10 Log】、【Inverse Square Root】、【Inverse】、【Power】、【Logit】和【Arcsin Sqr Root】,这些都是对响应值整体做数学处理,不是改因子水平。

 

  4、先按数据类型选一个合理方向

 

  如果你的响应是计数或频数,通常先看平方根;如果是增长量、方差类数据,常先看对数;如果是速率或衰减型数据,常看倒数;如果是有上下界的良率或比例,更多会用Logit或Arcsin平方根。这样做不是死规定,而是先给自己一个起点,避免没有方向地来回试。

 

  5、改完以后要整套重跑

 

  这一步特别容易漏。官方明确写到,只要应用了变换,分析就需要重新做一遍,而且模型往往会因此变得更简单,显著项数量也可能变化。所以不能只改个选项就接着看旧结果,必须重新检查【ANOVA】和【Diagnostics】。

 

  二、Design Expert Box Cox怎么用

 

  Box Cox不是单独拿来下结论的,它更像一个判断器,帮你缩小变换范围。你真正要做的,是借它找到方向,再回到分析设置里把变换落下去。

 

  1、在【Diagnostics】里打开Box Cox图

 

  完成初步建模后,进入【Diagnostics】查看Box Cox图。官方把它定义为帮助选择幂变换的工具,也就是说,它主要服务于平方根、对数、倒数和幂函数这一路,不是所有变换都会从这里自动给答案。

  2、先看λ对应哪一类常见变换

 

  官方给出的对应关系很清楚,λ等于1代表不变换,λ等于0.5代表平方根,λ等于0代表自然对数,λ等于负0.5代表倒平方根,λ等于负1代表倒数。实际看图时,不用死盯小数点后几位,先看最佳λ更靠近哪一种标准形式就行。

 

  3、重点看推荐值和置信区间

 

  Box Cox图真正有用的,不是那条曲线本身,而是软件给出的推荐变换。官方说明说,软件会优先推荐落在95%置信区间里、同时又最接近最佳λ的标准变换;如果区间里没有合适的标准形式,才会建议你用【Power】并直接采用最佳λ。

 

  4、如果区间包含1,先别急着变

 

  官方明确提到,如果最佳λ的95%置信区间把1包进去了,软件通常不会推荐特定变换。这种情况下,往往说明当前不变换也说得过去,除非别的诊断图仍然很差,否则没必要为了变换而变换。

 

  5、按建议改完后再看一次Box Cox

 

  软件文档和教程都提到,应用推荐变换后,还要重新分析,再回来检查Box Cox和其他诊断图。有时第一次建议是对数,改完重跑后模型项发生了变化,推荐可能又变成平方根,所以Box Cox的作用是迭代判断,不是看一次就结束。

 

  三、Design Expert变换后结果怎么看

 

  变换真正有没有用,不看你改得多复杂,而看模型是不是更稳、图是不是更顺、解释是不是更清楚。只要抓住这几个点,后面的结果就不容易看偏。

 

  1、先看残差图是不是比原来顺

 

  变换后先回【Diagnostics】重新看正态残差图和残差散点图。要是点分布比原来更自然,异常弯曲和明显漏斗感减弱,说明这次变换多半是起作用的;如果图形变化很小,甚至更乱,那就别急着保留它。

 

  2、再看模型有没有变得更干净

 

  官方提到,应用变换后,模型经常会更简单,显著项可能反而变少。这不是坏事,很多时候说明原来那些看着显著的项,其实受不稳定方差影响比较大。只要拟合逻辑更顺,模型更简洁反而更好解释。

 

  3、遇到零值和负值要先处理

 

  Box Cox所针对的幂变换只能用于大于零的响应值,官方也特别提醒,如果数据里有零值或负值,往往要先给全部响应加一个常数,再去尝试这类变换。这个动作最好在分析前就想清楚,不要等软件报错了再临时补。

 

  4、Logit和Arcsin平方根要手动判断

 

  这两个变换虽然也在软件选项里,但官方写得很明白,它们不是幂变换,所以Box Cox永远不会主动推荐。也就是说,如果你的数据本来就是比例、概率或者不良率,就算Box Cox没给提示,也要根据数据类型自己判断是否切到这两种形式。

  总结

 

  Design Expert回归模型怎么做变量变换,Design Expert Box Cox怎么用,顺着做其实并不绕。先正常建模,再看【Diagnostics】,再用Box Cox判断幂变换方向,然后回到变换设置里修改【None】,最后重新跑完整分析并复查诊断图。这样做的好处是每一步都有依据,不会把变量变换用成碰运气的试错动作。

135 2431 0251