当前位置: 首页 学术资源学位

偏最小二乘回归算法改进及应用

作者: 丁磊
专业: 应用数学
导师: 胡锡健
授予学位: 硕士
授予学位单位: 新疆大学
关键词: 偏最小二乘回归;多重共线性;变量选择;算法改进;潜变量
摘要: 偏最小二乘回归(Partial Least Squares Regression,PLSR)是一种先进的多元统计分析方法,于1964由瑞典计量经济学家Herman Wold等人首次提出,主要用来解决多元回归分析中的变量多重相关性或变量多于样本点等实际情况的问题.由于它集多元线性回归分析,主成份分析和典型相关分析的基本功能为一体,因此在国外被誉为第二代多元统计分析方法,该方法目前已广泛应用于化学计量,工业设计,计量经济学等各个领域. 本文的主要内容可以概述如下: 第一部分主要阐述了偏最小二乘方法的历史和现状,并对偏最小二乘回归近期的热点问题进行了总结. 第二部分详细介绍了偏最小二乘回归的基本思想,数学原理和单因变量偏最小二乘的算法推导,并利用该方法对防治沙尘暴研究进行了偏最小二乘回归建模分析,从中发现抑制沙尘暴的根本办法不是治理沙漠,而是要控制土地沙漠化和抑制裸露农田起尘. 第三部分在回归分析中经常存在自变量过多并且之间存在多重相关性现象,为了寻找对因变量有重要影响的自变量,本文提出了偏最小二乘向前逐步回归法,并对该方法进行了详细的理论推导.同时,运用SAS软件,利用该方法对化工领域的典型数据进行建模分析,结果发现,该方法易于操作,具有一定的实用性.另外,在多指标体系中建立综合评价指数时,往往会遇到指标变量集合间存在多重相关性问题,而传统的主成份分析并不能解决该问题,针对这种情况,本文采用PLS路径分析的思想,构建综合评价指标,对中国西部城市综合评价进行实证分析. 第四部分针对偏最小二乘回归无法对未来值进行预测的问题,采用了偏最小二乘时间序列预测模型.一方面,针对因子间的多重相关性现象,采用偏最小二乘回归建模,从而明确各因子对因变量的影响程度;另一方面,根据构成因子数据的特点,利用 AR(p)模型对各因子未来值进行预测,然后将其代入已建成的偏最小二乘回归方程,从而实现对因变量未来值进行预测.本文利用该方法对烟台市年生活用水量进行了实证分析.
Copyright 2006-2017 All Rights Reserved
版权所有:北京市石景山区图书馆