回归分析用于对响应变量与一个或多个预测变量之间的关系进行建模。STATGRAPHICS Centurion提供了大量用于拟合不同类型回归模型的程序:

程序Statgraphics Centurion  18/19Statgraphics
Sigma express
Statgraphics
stratus
Statgraphics
Web 服务
StatBeans
单样本分析
异常值识别
比较两个独立样本
比较两个配对样本
比较多个样本
比较比率和比例  
均值的等价性和非劣效性检验    
方差的等效性和非劣效性检验(仅限 V19)    
幂转换   

简单回归

最简单的回归模型包括单个响应变量Y和单个预测变量X。STATGRAPHICS将拟合各种函数形式,按R-平方降序列出模型。如果怀疑异常值,可以使用抗扰方法来拟合模型,而不是最小二乘。

sreg2.png
sreg1.png

更多:简单回归. pdf

Box-Cox变换

当响应变量不服从正态分布时,有时可以使用Box和Cox的方法来寻找改进拟合的变换。他们的变换基于Y的幂。STATGRAPHICS将自动确定最佳幂并拟合适当的模型。

boxcox.png

更多:Box-Cox Transformations. pdf

多项式回归

拟合非线性方程的另一种方法是考虑X的多项式函数。出于插值目的,多项式具有能够逼近多种函数的吸引人的特性。

polyreg.png

更多:多项式回归. pdf

校准模型

在典型的校准问题中,测量了许多已知样品,并拟合了一个将测量值与参考值联系起来的方程。然后,通过在测量样品后生成逆预测(从Y预测X),拟合的方程用于预测未知样品的值。

calibrate.png

更多:校准模型. pdf

多元回归

多元回归过程拟合将响应变量Y与多个预测变量X1、X2、…相关的模型。用户可以在拟合中包含所有预测变量,或者要求程序使用逐步回归来选择仅包含重要预测变量的子集。同时,Box-Cox方法可用于处理非正态性,Cochrane-Orcut过程可用于处理自相关残差。

mreg.png

更多:多元回归. pdf

回归线的比较

在某些情况下,有必要比较几条回归线。STATGRAPHICS将为“BY”变量的每个水平拟合平行或非平行线性回归,并进行统计测试以确定线的截距和/或斜率是否明显不同。

compreg.png

更多:回归线的比较. pdf

回归模型选择

如果预测因子的数量不过多,则可以拟合包含1个预测因子、2个预测因子、3个预测因子等的所有组合的回归模型,并根据拟合优度统计量对模型进行排序。在STATGRAPHICS中,回归模型选择过程实现了这样一种方案,选择给出调整后R-Squared或马洛斯 Cp统计量的最佳值的模型。

regsel-1.png

更多:回归模型选择. pdf

岭回归

当预测变量之间高度相关时,所得最小二乘拟合的系数可能非常不精确。通过在估计中允许少量偏差,通常可以获得更合理的系数。岭回归是解决这些问题的一种方法。通常,少量偏差会导致估计模型系数方差的显著降低。

ridge.png

更多:岭回归. pdf

非线性回归

大多数最小二乘回归程序旨在拟合系数中线性的模型。当分析师希望拟合本质非线性模型时,必须使用数值程序。STATGRAPHICS非线性最小二乘程序使用由于Marquardt的算法来拟合用户输入的任何函数。

nonlin.png

更多:非线性回归. pdf

偏最小二乘法

偏最小二乘旨在构建一个将多个自变量X与多个因变量Y联系起来的概率模型。当有许多预测因子并且分析的主要目标是预测响应变量时,该过程最有帮助。与其他回归过程不同,即使预测变量的数量超过观测值,也可以得出估计值。PLS被化学工程师和化学计量学家广泛用于光谱校准。

pls_1.png

更多:偏最小二乘. pdf

一般线性模型

当预测因子包括定量和分类因素时,GLM程序很有用。当拟合回归模型时,它提供了轻松创建曲面和等高线图的能力。

glm1.png

更多:一般线性模型. pdf

生命数据回归

为了描述外部变量对故障时间的影响,回归模型可能是合适的。不幸的是,标准最小二乘技术不能很好地工作,原因有两个:数据经常被删失,故障时间分布很少是高斯的。出于这个原因,STATGRAPHICS提供了一个特殊的程序,将生命数据回归模型与删失相匹配,假设要么是指数、极值、逻辑、逻辑、对数正态、正态或威布尔分布。

lifereg.png

更多:生命数据回归. pdf

比例的回归分析

当响应变量是比例或二进制值(0或1)时,必须修改标准回归技术。STATGRAPHICS为这种情况提供了两个重要的程序:逻辑回归和概率分析。这两种方法都产生了一个限制在0和1之间的预测方程。

logit.png

更多:逻辑回归. pdf概率分析.pdf

计数的回归分析

对于计数的响应变量,STATGRAPHICS提供了两个过程:泊松回归和负二项式回归。每个都适合涉及定量和分类预测因子的对数线性模型。

poisson.png

更多:泊松回归. pdf负二项式回归.pdf


正交回归

正交回归过程旨在构建一个概率模型,描述当X和Y都有误差时,单个定量因子X对因变量Y的影响。27个线性和非线性模型中的任何一个都可以拟合。

orthreg1.png

更多:正交回归. pdf观看视频

分类和回归树

分类和回归树过程实现了一个机器学习过程来预测数据中的观察结果。它创建了2种形式的模型:

  1. 根据观察到的特征将观察结果分成组的分类模型。
  2. 预测因变量值的回归模型。

模型是通过创建一棵树来构建的,树的每个节点对应一个二元决策。给定一个特定的观察,一个人沿着树的分支旅行,直到找到一个终止的叶子。树的每一片叶子都与一个预测的类或值相关联。

cart.png

更多:分类和回归树. pdf

分段线性回归(版本19)

分段线性回归程序旨在拟合一个回归模型,其中因变量Y和自变量X之间的关系是由2个或多个线性段组成的连续函数,该函数使用非线性最小二乘估计,用户指定段的数量和段连接位置的初始估计。

piecewise-1更多:分段线性回归. pdf或者观看视频

分位数回归(版本19)

分位数回归过程适合线性模型来描述因变量Y的选定分位数与一个或多个自变量之间的关系。自变量可以是定量的,也可以是分类的。与标准的多元回归过程不同,模型用于预测平均反应,分位数回归模型可以用于预测任何百分位数。中值回归是一种特殊情况,其中要预测的分位数是第50个百分位数。

quantreg更多:分位数回归. pdf

稳定性研究(第19版)

制药公司通常使用稳定性研究来估计药物降解率和确定贮藏寿命。测量通常是在不同时间点对来自多个批次的样品进行的。主要兴趣是估计降解模型的预测下限超过药物规格下限的时间。根据数据的结构,批次可以被视为固定或随机因素。

stability-1

More: Stability Study.pdf or Watch Video

零膨胀计数回归(版本19)

零膨胀计数回归过程旨在拟合因变量Y由计数组成的回归模型。拟合的回归模型将Y与一个或多个预测变量X联系起来,这些变量X可以是定量的,也可以是分类的。它类似于泊松回归和负二项式回归的过程,只是它包含一个额外的组件,表示出现的零比这些模型中预期的要多。包含多余零的数据非常常见,包括学生缺课天数、不是每个人都有保险的人群中的保险索赔数量、制造物品的缺陷数量和野生动物数量等各种例子。

zip-1

更多:零膨胀计数回归. pdf观看视频

沪ICP备05040608号-14