公务员期刊网 精选范文 多元统计分析范文

多元统计分析精选(九篇)

多元统计分析

第1篇:多元统计分析范文

关键词:应用技术型;多元统计分析;课程实践教学

中图分类号:G4

文献标识码:A

doi:10.19311/ki.16723198.2017.05.071

0引言

多元统计分析是从经典统计学中发展起来的一个分支,是一种综合分析方法,它能够在多个对象和多个指标互相关联的情况下分析它们的统计规律,很适合自然科学和社会科学的特点。主要内容包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、多元方差分析、直线回归与相关、多元线性回归与相关(Ⅰ)和(Ⅱ)、主成分分析与因子分析、判别分析与聚类分析、Shannon信息量及其应用。

多元统计分析是一门研究多指标随机现象统计规律的统计学科,随着计算机的普遍应用和软件的迅猛发展以及大数据时代的来临,使得自然科学和社会科学的各个领域都广泛的用到多元统计分析方法,比如在经济、金融保险、生物医学、环境数据、管理工程等相关领域。尤其是多元分析方法在处理多维数据时,它必不可少的分析工具。作为统计学的主要分支,多元统计分析方法正在向人类生活和生产的每一个角落渗透,其分析理论也在实际应用中逐步的完善和发展。多元统计分析也可以对国家的宏观经济形势进行深入分析,并以直观的方式进行宏观经济建模,为经济决策提供了理论支持。

所以,作为讲授多元统计分析这门课程的老师,扮演着相当重要的角色,那就是如何引导学生学习和掌握这门课程,为学生进入理论研究部门和实际应用部门打下夯实的基础。培养应用型统计学人才,应当是既能够胜任企事业和行政职能部门的统计人才,又是能从事市场调查与分析、经济统计与预测的经济人才。于是本了如下的践与探索。

1《多元统计分析》课程实践教学现状

1.1数理统计学基础知识不足

《多元统计分析》是运用数理统计学的方法来研究多指标随机现象统计规律的一门统计学科。它是一元统计分析在维度上的推广。同时,《多元统计分析》也是数理统计学的一个重要分支。所以数理统计学基础是至关重要的,而数理统计学基础偏理论一些,不会有太多的应用题,抽象的概念很多,之所以感觉抽象是因为忽略了定义的来源和下定义的出发点,这样就很难理解抽象的概念,运用就更谈不上了;很多同学在学习过程中不注重各种定理的来源和证明,其实这些定理的证明过程也是必须要理解并能掌握其证明方法的。整个几门数理统计学基础课程线性代数基础、矩阵论、概率论与数理统计基础知识的不牢固,更何谈融会贯通了,而多元统计分析这门课程是建立在有一定数理统计学基础上的,尤其是概率论与数理统计方面的基础知识,因为教材中都是一些联系很紧凑的理论,而且有些推证简化了过程的证明和计算,如果没有一些数理统计学基础,就不知道定理结论的来源,这样只能是死记结论,导致不能很好的应用所学知识,如果没有这些就不能更好的掌握多元统计分析的理论与方法,也不能更好的理解多元统计分析中的基本概念。

1.2重传统的数理逻辑的推证,轻统计思想的讲解

我们在整个实施教学过程中,经常使用的教学方式是强化传统的数理逻辑的推证,简化对统计方法适用性的变别能力以及利用这些方法分析经济数据能力的练习,这是老师们在讲授多元统计分析这门课程时经常会忽略的问题。学习多元统计分析的最终目的是要应用于现实,分析和解决现实问题。老师在讲授这门课程时往往侧重在数理方法的推导上,这也导致很多同学把重点放在反复推敲理解这些证明过程上,而对于分析方法和公式在现实中的应用并不重视。因此学生只是被动性学习,没有主动去探索问题,最终也不知道如何使用统计分析方法。

课程教学方法还是照搬我国传统的理科教学方法,即“重点知识+例子说明+技巧解题”,这种固定的教学过程,看似完成了教学任务,但是学生的学习效果不能得到保证,这些技巧大多情况是学过之后很快就会忘记,所以我们也可以感觉到,当前多元统计分析在教学中存在一些问题,我们只是一味的强调怎样运用技巧解题,不去教学生如何用方法处理实际问题,这样的教学失误只注重理论上的教与学,既缺乏探究性和开创性,又缺乏实际运用训练。很多学生反映总是有种学到的不能用到实处的感觉,学习也是为了应付考试,所以这种传统的教学方式难以培养应用技术型统计学人才,与其他先进的学科教育相比缺乏生动性与普遍性。

1.3案例教学中存在的问题

案例教学法的采用给多元统计分析学科的教学实践带来很多好处,然而,如果运用不适当,其好处和作用就不能真正体现出来。但是如果忽略理论知识的学习,只是重视案例的学习,此类主要体现在学生身上。例如在教学实践中老师们经常会遇到学生建议少讲理论知识,多增加案例分析的情况。在学生们看来,理论性的概念和统计原理太单调乏味,然而忽视理论知识的学习,没有牢固的基础,不能积极参与到具体案例分析的讨论中来,听而不思考,思维过程就难免具有依赖性,即被动的接受学习,这类学生普遍缺乏体验性学习和研究性学习。而且,目前大多数高校统计学科教师在案例教学中所采用的案例素材也有不少问题,主要体现在以下几个方面:第一,不能很好地结合教学目的选择案例。任何学科案例教学所使用的案例都应该服务于教学目的,若是不能明确案例教学要解决的是统计领域内什么层次的问题,要提高的是学生哪方面的能力水平,案例教学就无法达到预计的效果。第二,教学实践中使用的案例时效性较差。没有结合社会经济的热点问题开展案例教学,难以被学生理解、接受和认可。在这种传统教学案例中,我们只看到知识的积淀而感觉不到对求索的追求;只看到记忆与理解而感觉不到质疑与批判;只看到“学会”的成果而感觉不到“会学”的收获、“乐学”的体验。

2应用技术型统计学人才培养中《多元统计分析》课程实践教学的创新研究

我们要以统计学思想的培养以及统计学方法在经济管理领域中的应用作为本R到萄У幕本目标,推动教学方法的改革。我们经过自己的教学实践与思考指出了多元统计分析学科教学中存在的问题,并就改进多元统计分析学科教学提出了若干建议。

2.1以我国经济真实数据编写案例,结合社会热点开展案例教学

在进行案例教学的过程中,多元统计分析要注意以我国现行经济运行中的真实数据为素材编写案例,并结合社会经济的热点问题开展案例教学。比如“以我国2013年-2015年的社会消费品零售总额的真实数据为样本建立统计预测模型,并利用该模型对2015年-2017年进行社会消费品零售总额的预测分析”;“以我国2013年1季度至2016年4季度的GDP季度真实数据,建立统计预测模型,估计与检验,然后预测2017年1季度至4季度的GDP。”如果我们准备这样的案例进行教学,就能使学生对所学的东西感兴趣、有好奇心和探究欲。

作为一种综合分析方法,多元统计分析只能作为一种定量和定性分析的工具,对案例进行深刻剖析。在案例教学实施中,应当以学生为主体,教师处于主导地位。任课老师需要及时掌握案例教学的进度,把握住同学们课堂讨论的内容和方向。案例教学法有利于激发学生学习的积极性和主动性,我们学习多元统计分析这门课程就是要学会处理数据并能进行定量分析,如统计预测法、核算的方法、指数模型方法、经济计量方法等,因此,在教学实践中任课教师需充分利用案例法开展教学活动,注重对学生们进行统计方法适用性的识别能力以及利用这些方法分析数量经济数据能力的训练。而在选取教学案例方面则应该注意把握选取案例的目的性、时效性和实用性,即要使所选取的案例既符合理论知识一致,服务于教学目的,又能紧跟当前社会经济发展,同时还一定要选择教师自己能够把握,学生便于理解、掌握和认可的案例。

2.2积极开展实验教学,将理论教学与实验教学相结合

实验教学是多元统计分析课程教学中必不可少的环节。学生通过亲自操作,能够加强对各统计分析方法的理解,并从中探索出一些新问题。然而,在教学过程中也出现了一些新问题。具体的来说,理论教学和实验教学有些脱离,理论教学的原理及其步骤的推导与实验基本脱节,使学生感到理论推证的没必要,实验教学中,使用统计MATLAB软件、SPSS软件、SAS软件、R软件等的缺点是只求结果不论原因和运行环境,理论的学习得不到实践环节的练习和巩固,使学生难以琢磨,就像“雾里看花”,这样实质上没有达到课程教学真正的要求。作为一套可以提供一些集成的统计工具,统计软件更重要的是它可以提供各种数学计算、统计计算的函数,并使使用者能灵活机动的进行数据分析,甚至还可以创造出符合需要的新的统计计算方法。例如MATLAB软件就是借助软件的统计工具箱中计算的函数完成,在实验教学过程中,我们强调训练对实验结果详细的统计分析能力,要学生根据所学的多元统计分析方法的理论步骤,分步骤编程独立完成。这样不仅使学生确实掌握各个多元统计分析方法的基本原理与步骤,而且也有针对性的使学生学习了MATLAB软件中相关基本的操作方法,真正地做到掌握该软件,在实验环节又一次巩固了学生对理论问题的学习,在实验完成后要求同学根据自己的亲自体验写实验报告。这样在每次实验中,大多数学生在实验中都有收获而且会有更深刻的思考,从而达到了教学目的。

2.3拓宽学生视野,加强师资建设

除了从实践中寻求帮助外,还应尽可能给学生们提供与统计学专业相关的、教师交流的机会和平台,使学生们切身感受到学习多元统计分析的重要性,从而调动学生学习统计学的积极性;适当吸纳优秀学生加入到教师的相关科研活动中,充分挖掘学生学习和研究的潜力,这样不仅注重了学生的“学”,同时还让学生体会到学习不仅是学的过程还是一个探究的过程,这样不仅优化了教学质量,还能取得更佳的教学效果。与此同时,统计学教师要保证有充分的时间去学习和掌握经济统计领域相关的实务操作,因此学校可适当安排教师分批去企业培训和锻炼,以此提高教师自身在统计实务方面的处理能力,增强教师的实践经验;有条件的学生还可以定期组织部分教师外出培训学习,提高教师在统计实践方面的水平,鼓励专业教师积极参加统计专业相关的技术资格考试以取得相应资格证书,达到“双师型”教师的要求;聘请国内高校相关专业知名教授做学校的兼职教授来指导青年教师,通过与本专业知名专家学者的亲身交流和学习提高青年教师的专业理论水平和实践教学水平;在教学实践方面,学校可以充分调动各方资源,如聘请公司、企事业、地方统计部门等实践能力强的专家或青年教师担任学生专业实践的指导教师,开阔学生们的眼界,帮助提升统计学课程实践教学的质量。

2.4在教学中融入数学建模思想

数学建模方法侧重于对实际问题的处理,在实际问题中庞大的信息数据量往往在对数据的处理和分析上提出更高的要求,要从表面上看起来杂乱无章的数据中发现和提炼出有规律性的结论,必须要掌握必要的统计分析工具,一些具有实际意义的数学建模实例,成为多元统计学分析应用的经典材料,这正是多元统计分析的“用武之地”,用多元统计分析方法解决了实际问题,这也正是多元统计分析解决了数学建模问题,即所谓融入数学建模思想,也提高了学生处理实际问题的能力。在讲授多元统计学分析课程中融入数学建模思想与方法,结合元统计学分析中基本概念、公式、统计理理以及分析方法的教学,鼓励学生积极运用统计软件和工具,对现实生活和产生的真实现象和数据等信息加以整合、归纳,经过演绎、求解以及推断,从统计学专业角度给出分析与预测,再经过翻译和解释,返回到实际生活中,用实践来检验这些数据的准确性。通过“实践―理论―再实践”的循环,让学生采用数学建模的理论与方法在平常的学习中掌握多元统计分析。

3结束语

通过《多元统计分析》课程实践教学的创新研究,一方面,可以理清今后统计类专业建设的方向,即以培养学生综合运用统计理论知识和方法解决实际问题的综合能力和实践能力,作为统计人才培养改革与专业建设的导向。另一方面,通过对统计类专业实践教学创新模式的探索,可以使该专业的课程实验、毕业设计、生产实习等与统计实际工作联系较密切的环节既按照教学要求实施,又能有针对性地增强教学效果,这对提高该专业的实践教学质量具有关键的教学研究意义。更重要的是,对实践教学创新的探索,能够充分体现该专业产学研结合的统计人才培养特色,进一步推动该专业教育教学改革和发展,也更加拉近该专业学生与经济管理部门、相关企业的距离,进一步消除学生对统计工作的陌生感,缩短毕业生进入统计工作岗位的适应期,这对扩大毕业生就业面,增强毕业生就业能力,提高该专业以及学校的社会知名度,也具有现实意义。此外,统计学是作为我校学科整体布局中的一个重要组成部分,构建培养技术应用型人才的统计学专业实践教学体系,将推动统计学专业的教学模式改革,也将给其他学科专业的教学改革以一定的示范和启发。

参考文献

[1]高惠璇.应用多元统计分析[M].北京:北京大学出版社,2005.

[2]王静敏.多元统计课程的创新改革研究[J].统计教育,2007,(10):2425.

[3]丁立旺,黄娟.对财经类专业概率论与数理统计课程的教学反思[J].当代教育理论与实践,2015,7(4):4648.

第2篇:多元统计分析范文

关键词:农业生产条件;农业经济发展;多元统计分析

农业在我国经济发展中起到非常重要的作用,受到自然条件的影响,全国各个地区的经济发展水平存在很大的差异性,当地政府对农业的重视程度和政策帮助力度不同,也影响到了各个地区农业的发展。基于多元统计分析,可以分析出各个地区农业生产条件的优势和不足,制定出相应的农业发展策略,进而提高农业经济发展水平。

1多元统计分析

多元统计分析属于数理统计中非常重要的一部分,在进行多个分析指标的统计时,往往需要用到数理统计分析来进行多个统计指标之间的理论和实践研究。多元统计分析有多种分析方法,比如说主成分分析、聚类分析等。在进行多元统计分析时,往往需要结合多个统计指标来进行,将多元统计分析应用到农业生产条件中,可以充分掌握气候、农药、化肥等多个方面的因素,寻找各个指标之间的联系性,再进行数学模型的建立,结合当地实际情况,对农业经济发展有清晰的了解,再制定出相应的政策制度,合理地对现有农业资源进行分配,最终实现促进农业经济发展的目的。

2多元统计分析的应用和实践

在探究农业生产条件对农业经济发展的影响时,选择多元统计分析的方式,可以最大化运用农业生产条件,科学的分配农业资源,提高农业经济效益。在实际的分析时,可以先对当地的农业生产条件进行统计,比如说劳动力情况、机械化水平、气候条件、耕地面积等。因为每个地区的实际农业生产条件都不相同,比如说西南地区,影响农业经济发展最主要的因素是农村劳动力,耕地面积、机械化水平等远没有劳动力重要。其主要的原因是因为西南地区的地形情况比较复杂,没有大面积的耕地,严重限制了农业机械的应用,往往需要采取人工的方式来完成耕种,因此需要大量的劳动力。运用关联分析在进行农业生产条件的分析时,绝大多数地区的耕地面积与农村劳动力关联不是很紧密,与物质生产条件的关联程度在逐年加大。造成这种现象的原因是,受到科学技术的发展影响,对传统的种植方式带来了很大的改变,提高了农作物的产量,农业生产机械化程度越来越高,进而耕地面积以及农村劳动力的重要性已经没有之前那么重要。对于农业生产工具、化肥农药等的使用不断加大,再加上各个地区的实际生产条件有所不同,导致了农业生产条件重要性的改变,需要结合实际情况对农业生产条件进行调整,最终促进农业经济的发展。

3改善农业生产条件,促进农业经济发展

农业生产条件直接影响到农业经济的发展,一定要做好农业生产条件的利用工作,促进农业经济的发展。在实际的生产过程中,随着耕地面积以及劳动力在生产条件中的地位逐渐降低,但是耕地面积以及劳动力又是农业生产中的必要条件。因此,在进行农业生产条件的改善时,要加大对种植技术的研究力度,提高单位耕地面积的产量;要增强农村劳动力对科技的运用能力,提高农村劳动力的文化水平,结合先进的科学技术来开展农业生产,提高农业生产的产值,促进经济发展。在对农业生产条件进行改善时,不仅要从传统生产方式上进行改善,还需要从本质上进行变革,比如说病虫害的防治、栽培技术、育种方式等。在病虫害的防治方面,科学合理地选择防治农药,可以减少病虫害对农作物的损失,提高农业生产产量,在使用农药时,要注意农药的更换使用,避免长期使用1种农药,进而使得病虫害产生抗药性失去防治作用。在进行化肥的使用时,一定要注意化肥的选择和化肥的搭配,农作物不同的生长时期要选择不同类型的化肥,化肥的搭配一定要合理,这样才能促进农作物的全面生长,化肥之间不要存在一些酸碱性的冲突,要牢牢把握好化肥的用量,过多造成浪费,过少达不到增长目的。育种方式以及栽培方式在农作物的生产中也非常重要,好的育种方式和栽培方式可以增强农作物的成活率,提高产量。结合先进的科学技术改善农业生产条件,能够发挥出现代科学技术的价值和作业,促进农业经济的发展。

4结束语

多元统计分析应用到农业生产中,可以结合多项统计指标清楚地掌握农业生产条件,了解农业发展的优势和不足,结合先进的科学技术,制定出符合农业发展的策略,对农业生产资源进行合理配置,最终实现农业经济发展的目标。

参考文献

[1]郑晓杰.农业生产条件对农业经济发展影响的多元统计[J].农业工程,2014(2):108-109.

第3篇:多元统计分析范文

主成分分析法,又称主分量分析法是指相关的经济变量间通常存在着起主导作用的决定性因素,通过对原始变量的相关矩阵内部结构进行分析,找出几个不相关的综合指标来线性表示原来的变量,主成分之间既互不相关,又尽可能多的包含了原指标集合。这种方法首先由Hotelling提出,其主要思想是降维。Stone(1947)对美国1929-1938年间的17项国民经济统计指标进行主成分分析,发现完全可以用三个经济指标来概括原来的17项指标,大大简化了数据分析。M.Scott(1961)对英国157个城镇的发展水平进行主成分分析,发现原57个测度指标完全可以由5个综合变量替代,既解决了原指标间的信息重叠问题,又简化了原指标体系的指标结构,主成分分析由此推广。邱东(1990)系统阐述了主成分分析法的定义、基本思想、基本步骤和特点,认为主成分分析法可以消除评价指标间的相关影响,并且伴随数学变换过程生成信息量权数和系统效应权数,保证了客观性。同时也指出了主城分析法在计算综合评价值未充分考虑指标的重要程度等不足,主要适用于被评价对象较多的综合评价。随后,众多学者对此提出了改进:孟生旺(1992)针对原始数据的标准化处理和主成分个数的选择问题,认为标准化不如均值化的无量纲处理方法,提出了非标准化主成分分析法。陈述云等(1995)通过对原始数据作对数—中心化转换,用原始变量的非线性组合表示主成分,同时重点分析样本协方差矩阵而非相关系数矩阵,提出了非线性主成分法。朱泰英等(2004)提出了加权主成分分析法,认为可以将主成分分析法的客观分析和层次分析法的主观分析有机结合。王璐等(2006)在对主成分分析法的权数、降维等问题的研究上,提出了首先要按主成分分析法对指标体系进行分类,得到各方面的评价值后再进行主成分分析,最终得到综合评价值的二重主成分分析法。段力誌等(2009)在传统主成分分析法基础上,首先对原始指标值进行预处理,再借助软件,将原始数据转化为少数几个主成分的线性组合,并进行加权变换,得到改进的主成分综合值。白雪梅等(1995)则分析了“均值化”、“标准化”、“极差正规化”三种方法的选择条件是保证方差损失最小。陈衍泰等(2004)认为主成分分析法具有全面性、可比性和客观合理性等优点,比较适合对评价对象进行分类,但需要大量数据,函数意义不够明显,不能反映客观发展水平。苏为华(2012)提出经典的R型主成分本质是单项指标标准化结果的加权算术平均值,比当量平均法复杂。赵利等(2013)通过主成分分析法对宏观经济中影响城镇劳动就业因素分析时,提出主成分为宏观经济和技术进步,通过VAR模型对主成分进行分析,得出宏观成分中对城镇劳动就业影响最大的是消费、产业结构和城市化水平,而技术进步成分中影响最大的是技术进步的结论。黄利文(2013)针对主成分分析中存在的未考虑负向因子的影响,以及采用线性加权法时确定权重方法不统一,评价结果非唯一等缺陷,提出了逼近理想点的主成分分析法,更好地反映了原始数据信息,并较为客观地给出了综合评价结果。林海明等(2013)认为主成分分析因缺乏应用条件的考虑而导致评价结果不具合理性甚至错误,通过分析因子分析法因子载荷阵的简单结构、加权算术平均数的合理性,得出主成分分析的应用条件是:指标是正向、标准化的;主成分载荷阵达到更好的简单结构时,主成分正向,且主成分与变量显著相关。

二、因子分析

法因子分析法是指从被评对象的观察变量的相关度出发,利用降维的思想,把繁杂的变量尽可能归纳为几个综合因子进行分析的的一种多变量统计分析方法。其基本思想是:将观察变量按相关度的高低或联系的紧密程度进行分类,类别内部变量相关性高,联系紧密,而类别之间的变量则相关度较低,联系稀疏,每一类变量则代表一个公共因子。具体步骤为:

三、逼近理想解的排序法

第4篇:多元统计分析范文

(兵团第一师十团5连,新疆 阿拉尔 843306)

摘要:通过对45个陆地棉品种(系)的产量、品质性状进行多元统计分析,结果表明:产量性状的遗传改良潜力较大,而品质性状的遗传改良潜力较小:相关与偏相关均反映了产量性状间存在显著的相关关系,建立单株皮棉产量的回归方程,拟合效果较好,从通径和决策系数分析结果可看出,单株皮棉产量的影响因子大小依次为单株有效铃、单铃重、衣分:而产量与品质性状间的关系不显著。45个陆地棉品种(系)可以分为5类,其中第2类产量、品质性状综合表现优良,具有较大的利用价值。

关键词 :陆地棉;数量性状;相关回归分析;聚类分析

产量是棉花育种的主要目标之一,但由于影响选育高产棉花新品种成效的因素十分复杂,不仅有遗传因素、生理因素、生态因素、环境因素以及这些因素的相互作用等,还有组成棉花产量结构的诸因素间的相关性,以及这些因素同棉花本身其它性状间的相互关系。因此,要选育出增产潜力更大的高产新品种,必须从这些复杂的因素中找出影响较大的主要因素,以促进棉花育种工作不断深入。

回归分析是研究因变量和自变量之间变动比例关系的一种方法,最终结果一般是建立某种经验性的回归方程。回归分析因变量的多少有一元回归和多元回归之分,而多元回归又可分为一个因变量对多个自变量之间的回归。本文对45个陆地棉品种(系)的产量和纤维品质等多项数量性状进行回归分析,并以各品种相应的性状值进行聚类分析,进而对各类品种的产量和主要纤维品质性状进行分析,旨在为棉花新品种的综合评价及确定改良目标提供参考依据。

1 材料与方法

1.1 供试材料

45个陆地棉品种(系)为:792011、R25. 98-69、R1、R10、R11、R13、R16、R17、R19、R2、R21、R22、 R26、R3、R4、R5、R7、R8、R9、阿什36、超鸡脚、国欣棉、鸡脚棉、冀丰197、晋4、鲁28、彭泽芽黄、神丰抗6、苏702、塔什干、新抗巴农1号、新陆早13号、新陆早22号、新陆早24号、新陆早28号、新陆早35号、新陆早36号、新陆中26号、新字7号、中棉42号、中796292、中796392、中796432和中796472。

1.2 试验方法

本试验于2009年在塔里木大学植物科技学院育种试验地进行。试验材料采取随机区组设计,两次重复,行长5m,地膜覆盖种植,株行距配置为(10+60+10+60)cm×12.5 cm,于4月18日人工点播,其他管理同大田。10月下旬各小区中间取生长正常的5株棉株,考种测定铃重、衣分,用纤维品质测定仪检测纤维上半部平均长度、平均长度、整齐度、强度和马克隆值。

1.3 统计分析方法

利用EXCEL计算软件对测定数据进行初步整理分析,计算各个性状的2次重复的平均值,利用DPS统计软件进行各性状的相关分析、通径分析、逐步回归分析和聚类分析,聚类分析时原始数据进行标准化转换,样本间的距离采用卡方距离计算,聚类方法采用离差平方和法进行分析。

2 结果与分析

2.1 参试品种性状表现

从表1可以看出,参试45个品种(系)的各性状表现为供试群体的衣分、长度、强度等性状基本符合育种目标,但其单株有效铃、单铃重偏低,马克隆值偏大。群体各个性状差异较大。有效铃为3.2。12.1个:无效铃的变幅为O~4.5个,单株皮棉5.25~22.30 g。铃重最大的为5.6 g,最小的为2.8 g。马克隆值3.3~5.6,衣分34.8%~49.5%。纤维上半部平均长度为27.8~ 34.2 mm,平均长度为23.5~29.7 mm。纤维强度分布在28.2~35.1 CN/tex范围内。可以看出各个性状的表现在品种间差别较大,可以根据各个性状的表现型值进行分析加以聚类。变异系数反映了性状的变异程度,从表1中可以看出,单株有效铃、单株无效铃、单株皮棉重等性状的变异系数较大,说明这些性状的遗传改良潜力较大。上半部平均长度、强度的变异系数较小,说明它们遗传改良潜力较小。

2.2 性状间的相关分析

从表2可以看出,单株有效铃与单株皮棉重呈极显著正相关,说明单株有效铃越多,单株皮棉产量越高,但它与衣分和单铃重呈极显著负相关,即单株有效铃多,反而会使衣分、单铃重下降。单株无效铃可以反映品种的熟性情况,无效铃越多,该品种的生育期可能越长。单株无效铃与上半部平均长度呈负相关,而与平均长度呈极显著正相关。衣分、单铃重与单株皮棉产量均呈极显著正相关,说明衣分越高,单铃重越大,单株皮棉产量越高。单铃重与衣分间呈极显著负相关,说明单铃重增加,会导致衣分降低。而上半部平均长度与平均长度间呈极显著正相关,其它性状的相关均不显著。从表2的偏相关系数可以看出,单株有效铃、衣分、单铃重与单株皮棉产量均呈极显著正相关,即铃数多、衣分高、单铃重重,单株皮棉产量就越高。单株无效铃与上半部平均长度、平均长度、强度呈极显著正相关,说明生育期越长,棉花纤维品质可能越好。上半部平均长度、平均长度与强度间呈极显著正相关,说明长度与强度间存在一定的协同关系。长度、强度与马克隆值间的偏相关系数达显著水平,但为负值,说明纤维长度越长、强度越高,可能纤维的细度和成熟情况越好。综上所述,陆地棉主要产量性状间存在显著的相关关系,但与品质性状间相关关系不甚明显,说明陆地棉产量与品质可能存在同步改良的可能。

2.3产量性状间的回归分析

Y= -29.54+ 1.94X1+ 0.051X2+ 29.69X3 +3.13X4+ 0.059X7+ 0.063X8 (R2= 0.99)

(1)

分别以有效铃(xl)、无效铃数(X2)、衣分(X3)、铃重(X4)、纤维上半部平均长度(x5)、平均长度(X6)、马克隆值(X7)、比强度(X8)8个性状为自变量,单株皮棉产量为因变量进行逐步回归分析,建立了6个变量与单株皮棉间的回归方程。该方程的复相关系数和F值都达到了显著水平,剩余标准差也较小。说明这几个自变量可以预测单株皮棉的表现。但有效铃、衣分、铃重与单株皮棉的偏相关系数较大且显著,它们对单株皮棉的影响较大,而无效铃数、马克隆值、强度与单株皮棉的偏相关系数较小且不显著,即对单株皮棉影响较小。纤维上半部平均长度和平均长度对单株皮棉影响小而没有引入到回归方程中。可从回归系数的大小看出自变量对单株皮棉的作用大小,即有效铃、衣分和铃重的贡献较大。

2.4 性状间的通径分析

以单株皮棉产量为目标性状与其它6个产量品质性状间进行了通径分析,结果见表3。从分析结果可以看出,有效铃、单铃重、衣分对单株皮棉产量的直接通径较大,且均为正值,说明它们对单株皮棉产量均存在较大的贡献,贡献率大小依次为:有效铃>单铃重>衣分。所以各自变量性状对单株皮棉的直接作用大小可在一定程度上反映它们对单株皮棉的作用大小,但因自变量间存在相关而对目标性状产生间接作用(正向或负向间接作用),增加了分析的复杂性。各性状的决策系数的大小可反映各性状对目标性状的作用大小。决策系数最大的是有效铃,次之是铃重和衣分,最小的性状为比强度。可选择有效铃、铃重和衣分较好的品种,其单株皮棉也表现较好,各品种的实际表现型值与决策分析结果一致,并与相关分析及直接通径结果一致。

2.5 陆地棉品种(系)的聚类分析

对45个品种(系)进行系统聚类分析,各性状原始数据进行标准化变换,聚类距离采用卡方距离,聚类方法采用离差平方和法,聚类结果将45个品种分为5大类,第1类:R16、R10、R22、R3、国欣棉和中796472:第2类:R26、R2、R5、R9、阿什36、鲁28、神丰抗6和中796392;第3类:R8、R17、R19、R2、超鸡脚、彭泽芽黄和新陆早28号;第4类:98-6、792011、R1、R11、R13、R2,、R7、鸡脚棉、冀丰197、晋4、苏702、塔什干、新抗巴农1号、新陆早13号、新陆早22号、新陆早24号、新陆早35号、新陆早36号、新陆中26号、新字7号、中796292和中796432:第5类:R4。

从表4可以看出,第1类棉花品种(系)的单株有效铃多,单株籽棉产量和单株皮棉产量较高,即它们的主要产量性状较为突出,而品质性状在各类中最低。第1类遗传变异系数较大的性状有单株无效铃、单株有效铃和马克隆值,说明此类品种的熟性和铃数还有一定的改良潜力:第2类产量性状中等偏大,品质性状较优,因此,这类是综合性状优良的品种(系);第3类单株铃数、单铃重、衣分等均较低,品质性状属中等;第4类品种的产量性状、品质性状表现一般:第5类产量性状表现较差,即单株有效铃数较少,单铃重、衣分较低,但其纤维品质性状表现较为突出。

3 结果与讨论

(1)从45个供试品种(系)的变幅和变异系数可以看出各个性状的表现在品种间差别较大,单株有效铃、单株无效铃、单株皮棉重等性状遗传改良潜力较大,而上半部平均长度、强度的遗传改良潜力较小。(2)相关、偏相关分析结果及通径分析结果一致,表现为衣分、单铃重与单株皮棉产量均呈极显著正相关,说明衣分越高,单铃重越重,单株皮棉产量越高。对单株皮棉产量的贡献顺序依次为单株有效铃、单铃重、衣分,其它性状对单株皮棉产量的影响均较小:而产量性状与品质性状间相关关系不甚明显,即供试材料在产量与品质性状间不存在明显的负相关关系,说明陆地棉产量与品质可能存在同步改良的可能。(3)对45个品种(系)进行系统聚类分析,结果可将其分为5类,第1类棉花品种(系)的主要产量性状较为突出,而品质性状表现较差:第2类品种(系)的产量、品质均综合表现优良,在生产上具有较大的利用潜力:第3类棉花品种(系)产量性状表现较差,品质性状属中等;第4类棉花品种(系)的产量性状、品质性状表现一般:第5类棉花品种(系)产量性状表现较差,但其纤维品质性状表现较为突出。聚类分析结果可为育种时的亲本选配提供参考。(4)本试验中产量性状间的关系与其他学者的结论一致.但产量和品质性状之间不存在显著的相关关系,这与其它学者的相关研究结论不一致,这可能与不同地区各性状的影响主次有关,也可能与供试材料的广泛性有关.因本文的供试材料来源较为广泛,有不同时代的品种(系),也有不同国家、地区的品种(系),造成品种间性状差异大,可能会对结果产生一定的影响。

参考文献

[1]陈荣江,朱明哲,孙长法棉花新品种产量品质性状的综合评价及聚类分析[J].西北农业学报,2007,16(4):264-268

[2]顾双平,常晓阳.棉花品质性状的相关剖析[J].江西农业学报,2012,14(2):24-28

[3]刘英欣,张忠朕陆地棉主要经济性状的相关分析[J].种子,1998(5):26-28.

[4]刘垂纡.作物数量性状的多元遗传分析[M].北京:农业出版社.1991:59-100

[5]蔡应繁,潭永久,何洪华.短季棉与早熟性产量和纤维品质的主成分和典型相关分析[J].西南农业大学学报,1996,l8(4):346-348.

[6]陈荣江,王文峰,朱明哲棉花新品种产量性状与品质性状的典型相关与主成分分析[J].农业系统科学与综合研宄,2007,23(2):187-195

[7]蔡应繁,潭永久,何洪华.短季棉与早熟性产量和纤维品质的主成分和典型相关分析[J].西南农业大学学报,1996,l8(4):346-348.

第5篇:多元统计分析范文

[关键词] 多元统计分析;中药;质量控制

中药是指在中医理论指导下,用于预防、治疗、诊断疾病并具有康复与保健作用的物质,包括中药材、中药饮片和中成药等。中药是我国中医药文化的瑰宝,并以资源丰富、疗效独特和副作用少等优势成为国内外关注的焦点。但长久以来,原始、单一的中药质量控制方法,一直制约着中药质量的提高,随着科学技术的发展以及各种新仪器的问世,应用于中药质量控制的方法和手段也不断增加,从原来单一的质控指标发展到现在的多质控指标,这使得中药质量控制标准全面提高[1]。但这些构成指标体系的多个指标又各有侧重地解释着该中药的质量,其间必然存在着多重共线性。比如,指纹图谱在改变单一指标性成分评价中药质量所明显存在片面局限性的同时,也暴露出它自身的问题,即在表现众多成分的指纹峰中,什么是重点?哪些峰是可以放弃的?现实的要求是既不能“片面”,但也不能“一把抓”[2]。如果用一元统计方法一次只能分析一个指标,分析多个指标时就会忽视了各指标之间存在的相关性,分析的结果不能客观全面地反映情况。多元统计分析[3-7]能在不损失信息的情况下,通过变换和构造模型,剔除指标间相互制约的成分,寻找一个简单综合指标,将这些指标反映的内容综合起来,使复杂数据简单化。且有文献报道,多元统计分析能在一定程度上达到数据挖掘的目的,同时它的一些思想和功能也能在数据挖掘的数据收集、数据清理环节发挥作用[8]。因此运用多元统计分析对中药质控研究中出现的多指标、高维和大量统计数据且彼此之间相关的数据进行分析,可发现数据间的内在规律,以实现中药质量的有效控制。

1 多元统计分析的涵义

多元统计分析是同时分析和处理多组变量,从整体把握事件的特征和发生规律统计分析方法,其核心内容是总体参数估计的修正和统计推断,具体表现出来就是各类统计方法,如主成分分析、因子分析、聚类分析、判别分析和典型相关分析等[5]。多元统计分析应用于中药质量控制的研究有以下几种优势:①多指标性只有用相互关联的多个指标(即描述现象的多个方面)才能够对事物或现象的全貌有所了解,这是多元统计分析在中药质控研究多个指标的最大优点;②定量性多元统计分析就是用数学的方法来研究影响中药质量的多个指标之间相互依赖关系以及内在统计规律性的分析方法;③复杂性和数据计算量大等特点这是多元统计分析适宜于分析研究中药质控中出现的繁琐复杂数据的基础[9]。

2 多元统计方法在中药质量控制中的应用现状

多元统计分析广泛应用于经济管理、医学、教育、生物等诸多领域,其中以中医药为检索范围,在已检索到的运用各类统计方法的51 792篇文献中,包括多元统计方法的文献已达25 279篇,说明多元统计方法已在中医药研究中得到了广泛应用。而统计学理论和中医药理论客观存在的相合性,也说明了多元统计方法在中医药研究中的应用不仅是可行的,也是科学的[10]。运用多元统计分析对影响中药质量的多方面因素进行综合分析和评价,以实现对中药质量更准确,更全面地控制。下面分别介绍几种主要的多元统计分析方法近年来在中药质控中的应用。

2.1 主成分分析 主成分分析的定义为利用数学降维方法,寻找新变量替代旧变量群,新变量之间互不干涉,可独立进行分布统计,是一种将多数相关变量群替换成少数无关变量的方法[5]。主成分分析法能过滤虚假信息,减少无关指标的影响,已普遍应用于中药质量标准研究数据的统计分析中,以确定中药资源的分类和聚类,并从中获取能用于中药分析鉴别的有用信息,然后进行分析、鉴别、判断,进而进行分类和优选[11]。王劭华等[12]采用主成分分析对24批不同产地车前子样品中的10个共有峰面积进行分析,以累计方差贡献率达86.45%选取3个主成分,由主成分综合得分排序可知,综合品质较好的车前子品种为大车前子和平车前子,其中综合品质最好的为江西吉水婆婆庙产的大车前子;根据车前子主成分投影图可以将车前和平车前种子与其他品种车前种子区分开来。王琴等[13]应用主成分分析对不同地区枸杞中多糖和金属元素之间的相关性进行分析,以累积方差贡献率达88.181%筛选出3个主成分,结果表明多糖和常量金属元素钙(Ca),镁(Mg),钠(Na),钾(K)是影响枸杞质量的重要因素,微量元素铜(Cu),锌(Zn),铁(Fe)也是不可忽视的因素;其主成分得分可用于不同产地枸杞子质量的综合评价,为以后不同产地枸杞的开发利用奠定了基础。

2.2 因子分析 因子分析又称为探索性因素分析,是根据相关性大小把原始变量进行分组,使同组内变量之间的相关性较高,而不同组变量间的相关性较低[3-4]。因子分析也是利用主成分分析的降维思想,可看作是对主成分分析的推广和发展,但是其因子分析对于所研究的问题是根据原始变量的信息进行重新组合,以试图用最少个数的不可测的所谓公共因子的线性函数和通过旋转使得来的新变量对每个原始变量更具有可解释性。朵兴红[14]采用因子分析对党参、细辛等7种道地药材中Ca,Mg,锰(Mn),Cu,Fe,Zn 6种微量元素进行分析,以方差的贡献率大于99.75%提取2个主因子,分析结果表明这6种微量元素均对防治心脑血管疾病有一定的疗效,为微量元素与中药功效关系的研究提供了科学依据。多杰扎西等[15]采用因子分析对11个不同产地枸杞子中Zn,Cu,Fe,Mn等微量元素之间的关系进行研究,以累计方差达92.236%提取3个主因子,结果表明第一主因子与变量Zn和Mn有高的相关性,是枸杞子中起络合作用的微量元素,也是决定枸杞子质量的基本微量元素;第二主因子在变量Cu元素上有最高的载荷系数,是通过影响生物体内的酶、激素、维生素等生物活性物质,而发挥药效作用的微量元素;第三主因子在Fe元素上有最高的载荷系数,是在氧化还原等许多代谢中起到重要作用的微量元素,这3个主因子能够反映枸杞子中微量元素的分布特征;不同产地枸杞子的综合评价结果,与实际分类和质量的情况基本相符,如列于质量好的第一类、综合因子得分分列第二的宁夏某枸杞研究所,其培植生产的枸杞子质量高,一直起到行业示范作用。

2.3 聚类分析 聚类分析又称又称集群分析,是根据研究对象特征对研究对象进行分类的一种多元分析技术,把性质相近的个体归为一类,使得同一类中的个体都具有高度的同质性,不同类之间的个体具有高度的异质性[6]。聚类分析能够充分利用原始数据信息,除常用于中药系列品种的分类外,还可以广泛地引用于真伪鉴别、成分浅析、质量评价、新旧工艺或不同炮制方法比较、寻找代用品及扩大药用新资源等方面[16]。辛海量等[17]采用聚类分析,对不同来源的蔓荆子、黄荆子、牡荆子近红外漫反射指纹图谱进行分析,聚类分析结果与传统植物分类结果一致。李寒冰等[18]对不同批次的板蓝根抗病毒效价值进行聚类分析,聚类结果与常规质量等级分类一致,结果表明应用抗流感病毒效价检测方法,可以实现对板蓝根药材的质量控制。鄢丹等[19]采用生物热活性检测方法,以黄连道地优级药材为工作参照物、第一指数生长期生长速率常数(k1)为反应值,以量反应平行线(3・3)法设计试验,对7批不同产地的黄连样品的生物效应(效应谱和效应值)进行测定,并采用聚类分析对黄连的生物效价值进行分析,结果表明不同产地黄连的生物效应值存在差异,并以此划分的典型道地产区、一般道地产区和一般主产区,与传统对黄连的道地产区和主产区划分基本一致,生物效应值具有较强的产地专属性和指纹鉴定意义,生物热活性检测方法可作为传统生物效价检测方法的补充和提高。

2.4 判别分析 判别分析是根据一定量案例的1个分组变量和相应的其他多元变量的已知信息,确定分组与其他多元变量之间的数量关系,建立判别函数,然后便可以利用这一数量关系对其他未知分组类型所属的案例进行判别分组,主要包括距离判别、Fisher判别和Bayes判别分析等[6]。在实际应用中,当已知了类别的判别问题时,应选择判别分析;而当面对大量的数据,杂乱无章,而又需要分类时,应考虑聚类分析;二者有衔接之时,聚类分析可作为判别分析的预处理。白雁等[20]采用距离判别分析对来源于山东、山西和焦作的生地黄近红外漫反射指纹图谱进行分析,结果表明欧氏距离在0.6以上时生地黄被分为5类,其中山东因样品差异比较大,分成了3个区域,其他2个区域为山西和焦作样品,分类结果与实际基本一致,且15批验证集样品的预测集正确率为85%以上,为地黄产地鉴别方法提供1种新技术。吴文莉等[21]采用Fisher判别分析对105种中药中42种元素含量进行分析,以42种元素含量的百分位值,对依据全国大中专院校教材《中药学》查询的105味药物的寒、热、温、凉四性,建立4类Fisher判别方程,整体回判复合率为80.9%,研究表明通过分析测定中药中所含微量元素的量,能在一定程度上反映中药的性能,为进一步研究中药的物质基础提供指导。

2.5 典型相关分析 典型相关分析是对每组变量做1个线性组合,即为这组变量的综合变量,然后研究2组综合变量的相关,通过少数几个综合变量来反映2组变量的相关性质[7]。典型相关分析也是利用降维思想,主要对质量评价、成分浅析、新旧工艺或不同炮制方法比较、寻找代用品及扩大药用新资源等方面进行研究。王伽伯等[22]采用典型相关分析,对大黄炮制减毒机制和化学成分改变间的相关性进行探讨,结果表明炮制可降低大黄肝肾毒性,其机制与结合蒽醌和鞣质类成分的下降有关,其中与游离和结合态的芦荟大黄素及大黄素甲醚相关性最强;在肝肾生化功能指标中,血清谷丙转氨酶(ALT)和肌苷(CREA)对肝肾毒性较敏感,可作为临床监测指标,为大黄炮制工艺的优化及肝肾毒性临床监测指标的筛选提供了方法参考。卢林耿等[23]对利用典型相关分析,对中药复方制剂工艺因素和药物成分间的关系进行了分析,结果表明大黄素和淫羊藿苷受制剂工艺影响较大,而芍药苷几乎不受影响;煎煮时间越长,大黄素和淫羊藿苷含量越低;加水量越多,大黄素含量越低,而淫羊藿苷含量越高;浸泡时间与这3种成分的含量成反比,但其影响作用较小,典型相关分析在中药复方制剂工艺研究中的应用有其重要的价值。

2.6 多元统计的联合应用 近年来,不仅单一多元统计分析得到广泛应用,多种统计方法的联合运用也得到快速发展,它能够更客观地实现中药质量的全面控制。王海波等[24]利用因子分析、聚类分析对黄芪中的无机元素含量进行分析,因子分析和聚类分析法的研究都表明黄芪主要判别元素确定为K,Mg,Na,为从不同分析角度实现黄芪饮片的质量控制提供了依据。王晓燕[25]将寒性、热性各10味植物药所含的多糖成分水解成单糖,并测定单糖的HPLC图谱,利用主成分―线性判别对该HPLC图谱进行分析,20味中药判别结果与已知药性完全一致,表明中药寒热药性与所含的多糖成分存在明显相关性;主成分―线性判别可对中药药性进行判别,且判别准确率高。尹海波等[26]利用主成分分析和聚类分析,对10个不同产地的牛儿苗样品中24种无机元素的指纹图谱进行分析,以总方差贡献率为91.5%选取前5个因子,主成分分析得出其特征元素为铝(Al)、铊(Tl)、钡(Ba)、铁(Fe)、镧(La)、铈(Ce)、锂(Li)、镓(Ga)和钯(Pd),聚类分析将路边生长和山坡生长的牛儿苗样品聚为一类,结果表明元素的分布特征与牛儿苗的生态和产地呈一定的相关性。鄢丹等[27]利用相关分析对盐酸小檗碱和不同产地黄连样品的生物热动力学参数(包括生长速率常数、产热量、生长期最大产热功率和达峰时间),和常规抑菌活性评价指标抑菌圈直径进行分析,结果表明生物热动力学法可用于黄连抑菌活性的测定;对不同产地黄连药材的抑菌效价进行聚类分析,结果将不同产地的黄连聚为一类,为利用生物热动力学法和抑菌效价测定法共同实现黄连抑菌活性评价提供依据。

3 小结和思考

综上所述,多元统计分析能够用来进行中药资源的分类、优选、真伪鉴别、质量评价、成分浅析、新旧工艺或不同炮制方法比较、寻找代用品及扩大药用新资源等方面。虽然多元统计分析得到了广泛应用,但仍存在一定的不足,比如主成分分析在简化数据降低维数的过程中又有可能丢失信息;因子分析在采用的是最小二乘法计算因子得分时,此法有时可能会无效;典型相关分析是在原始变量服从多元正态分布,样本容量至少要大于原始变量个数,且原始变量组内要有一定的相关性等前提下进行的,在实际应用时要根据各种分析方法的优缺点和它们之间存在的内在联系及区别,选择合适的分析方法,以实现中药质量更客观有效的全面控制。

多元统计分析在鉴定中药的真伪和质量优劣方面的研究工作已取得了可喜的进展[28],但其研究尚未成体系。我们能否以常用的中药道地优级药材和其他产区的药材为模型进行研究,建立一个常用中药材真伪鉴别和质量优劣评估体系。即首先选取合适的分析方法如色谱、质谱或生物测定方法等,提取药材的特征数据如化学指纹图谱、生物效价或生物效应谱等;然后对其中一种或多种特征数据进行主成分分析、聚类分析或判别分析等,在分析结果与常规质量等级分类一致的基础上,利用该特征数据建立一个常用中药材真伪鉴别和质量优劣评估体系,再运用相应的分析方法对未知类别的样品进行归属判别,对中药的质量进行有效控制,以期早日实现中药的现代化和国际化。

[参考文献]

[1] 黄玉慧,郭力.中药质量控制方法研究进展[J]. 中药与临床,2012,3(4):54.

[2] 陶燕蓉,陈曦.中药质量评价技术的国内外研究现状及分析[J].中药与临床,2011,2(2):59.

[3] 何晓群.多元统计分析[M].北京:中国人民大学出版社,2000:168.

[4] 张润楚.多元统计分析[M].北京:科学出版社,2003:190.

[5] 朱小梅.多元统计分析方法在宏观经济分析中的应用[J].赤峰学院学报:自然科版,2013,29(20):5.

[6] 邓海燕.聚类分析与判别分析的区别[J].武汉学刊,2006,118(1):29.

[7] 赵峰.典型相关分析算法理论及其在模式分类中的应用[D]. 西安:西安电子科技大学,2005.

[8] 陈伟志,魏振军,王春迎.多元统计分析在数据挖掘中的作用[J].信息工程大学学报,2003,4(4):22.

[9] 薛伟,刘永久.浅谈《多元统计分析》课程教学[J].科技信息,2009(7):119.

[10] 马利,沈绍武,蔡晓红.多元统计方法在中医药研究中的应用[J].中医药信息,2009,26(1):46.

[11] 孔浩,郭庆梅,王慧慧,等.主成分分析法在中药质量评价中的应用[J].辽宁中医杂志,2014,41(5):890.

[12] 王劭华,曾金祥,朱玉野,等.车前子主成分分析研究[J].江西中医学院学报,2011,23(1):48.

[13] 王琴,龙启萍.枸杞多糖和金属元素的主成分分析[J].微量元素与健康研究,2013,30 (1):23.

[14] 朵兴红.主因子分析法用于中草药中微量元素含量的研究[J]. 微量元素与健康研究,2010,27(4):24.

[15] 多杰扎西,吴启勋.不同产地枸杞子中微量元素的因子分析[J]. 西南民族大学学报:自然科学版,2008,34(3):514.

[16] 李水福,胡清宇.试述聚类分析法在中药研究中的应用[J].基层中药杂志,1997,11(3):45.

[17] 辛海量,胡园,张巧艳,等.4种牡荆属植物来源生药的近红外漫反射指纹图谱聚类分析[J]. 时珍国医国药,2008,19(12):3037.

[18] 李寒冰,肖小河,鄢丹,等.中药质量生物控制模式和方法的研究――板蓝根抗病毒效价检测方法的建立[C].石家庄:2008年中国药学会学术年会暨第八届中国药师周,2008.

[19] 鄢丹,方艺霖,肖小河,等.基于生物热活性检测的不同产地黄连的生物效应评价研究[C].南昌:第九届全国中药和天然药物学术研讨会,2007.

[20] 白雁,李雯霞,谢彩霞,等.3种不同产地生地黄近红外图谱的判别分析[J].计算机与应用化学,2011,28(3):311.

[21] 吴文莉,马威,管竞环.中药寒凉温热四性的Fisher判别分析[J].中国中医药科技,2012,19(1):43.

[22] 王伽伯,马永刚,张萍,等.炮制对大黄化学成分和肝肾毒性的影响及其典型相关分析[J].药学学报,2009,44(8):885.

[23] 卢林耿,张宁,王中民,等.典型相关分析在中药复方制剂工艺研究中的应用[J].数理医药学杂志,1998,11(3):85.

[24] 王海波,邸学,杨欣欣,等.ICP-MS测定黄芪饮片无机元素因子分析和聚类分析[J].光谱实验室,2012,29(3):1523.

[25] 王晓燕.基于主成分-线性判别分析的植物药多糖HPLC图谱与寒热药性关系研究[J].山东中医药大学学报,2013,37(2):156.

[26] 尹海波,张囡,罗宏,等.不同产地儿苗无机元素的主成分分析和聚类分析[J].中国中药杂志,2010,35(15):1935.

[27] 鄢丹,肖小河.基于道地药材和生物测定的中药质量控制模式与方法研究――黄连质量生物测定[J].药学学报,2011(5):568.

[28] 于鹤丹.多元统计分析方法在中药质量评价中的应用[J].数理医药学杂志,2006,19(1):85.

Application of multivariate statistical analysis and thinking

in quality control of Chinese medicine

LIU Na, LI Jun, LI Bao-guo*

(Shandong University of Traditional Chinese Medicine, Ji′nan 250355, China)

[Abstract] The study of quality control of Chinese medicine has always been the hot and the difficulty spot of the development of traditional Chinese medicine (TCM), which is also one of the key problems restricting the modernization and internationalization of Chinese medicine. Multivariate statistical analysis is an analytical method which is suitable for the analysis of characteristics of TCM. It has been used widely in the study of quality control of TCM. Multivariate Statistical analysis was used for multivariate indicators and variables that appeared in the study of quality control and had certain correlation between each other, to find out the hidden law or the relationship between the data can be found, which could apply to serve the decision-making and realize the effective quality evaluation of TCM. In this paper, the application of multivariate statistical analysis in the quality control of Chinese medicine was summarized, which could provided the basis for its further study.

第6篇:多元统计分析范文

【关键词】多元统计分析 财务危机 应用

一、多元统计分析与企业财务危机预警

多元统计分析在在统计学中是一种综合性的分析方法,通过多个分析方式对于同一个对象进行全方位的分析,内容包括多种应用方式。通过多种方式的综合运用,在多个指标的共同参与之下,对于统计的规律进行揭示与挖掘,将这种多元化的分析手法应用于企业财务危机的预警中,是十分有效的,与现代企业管理的多元资金流和运作的资金链串接是有相同的运作模式的。

企业的财务危机主要是指企业在经营过程中由于无力按时偿还到期的债务而产生的危机和困难就是企业的财务危机,企业财务危机的出现有种种原因,管理不善、行业萧条、决策失误、名誉受损等等,都可能导致企业财务危机的出现,企业一般都是个体或者合营,依靠主要管理人员和决策人的共同努力发展壮大,所以对于管理人员的措施采纳和决策人的决定有严格的要求。一般来说,判断一个企业财务危机的常用标准是企业破产和在证券交易中面临的退市现象,注意,在证券公司面临退市的现象一般指的是上市公司,中国改革开放以后,证券行业发展迅速,企业的上市已经成为一个企业发展壮大的标识,所以本文研究的企业也包括上市公司。企业在生存发展的过程中,面临的财务危机是一项挑战,也是一项机遇,往往一个企业进行大刀阔斧的改革都是在企业财务危机之后,由于财务危机暴露了企业在发展过程中的弊端,所以企业在财务危机中能够顽强的生存下来,也就获得了成功的准备,将危机中显示出来的问题进行纠正,这样企业获得了良好的发展活力,更能在激烈的社会竞争力实现跨越式前进。

由于企业性质的不同,所以造成企业财务危机的原因也就不同,在企业财务危机预警的多元分析中,要根据企业的独特性采取相应的指标来完成分析,并且在模式模型选择过程中要根据企业财务危机的侧重点来进行选择,这样才能有针对性的提出分析的策略。根据我们选定的财务指标,利用聚类分析法对我国企业进行科学的统计分类;再用判别分析法构造预测判别模型,对其财务危机状况进行判定预测;最后利用主成分分析法提取主成分,计算各主成分的分数和综合得分,根据主成分综合得分对样本进行排序,以发现其财务危机状况,使用Excel电子表格中软件和统计分析软件SPSS来进行数据处理和建立多变量预警模型,这就是多元分析的主要步骤。

二、多元统计分析在企业财务危机预警中的应用

(一)样本和变量选取

在企业财务危机模型的建立过程中,对于企业的财务指标和参数,利用抽样方法进行选择。一般来说,选择的方式主要是随机抽样和对应样本法。在企业中,选取销售净利率、主营业务利润率、净资产收益率、资产净利率、每股收益(EPS)、应收账款周转率、存货周转率、总资产周转率、营运资本总资产比、资产负债率、流动比率、现金负债总额比(债务保障率)、现金流动负债比、现金流入流出比率、销售现金比率、每股净资产来建立指标体系作为分析变量等28个指标作为企业盈利、偿还等能力和资本实力的展现,也是全面地反映企业的财务状况的指标。在多变量模型的财务预警分析中,变量越多选择的余地越大,模型建立就越好。

(二)判别分析

根据样本和变量的选择,利用判别分析法建立企业财务危机的预警机制,在建立机制的过程中,可以根据研究对象创建一组函数,实现对于样本和变量的分析判别。一般来说,用的Fisher线性判别函数是判别分析中比较常见的。函数形式为:Yi=a1x1+a2x2+…+anxn+b(i=1,2,…,k)。其中k是判别组数,Y是判别分数或判别值;x1,x2,…,xn是因变量或预测变量;a1,a2,…,anj是各变量的系数,即判别系数;b是函数中的常数。通过这组函数对于基本的系数和常数进行计算,得出基本的财务危机指数、非财务危机指数以及中间指数。

在数字计算的过程中,判别分析建立的函数变量很多,将其中有显著性代表的变量函数作为典型例证进行分析计算,这样既能节省时间和效率,同时也能准确的代表了判别分析的结果。具体的判别分析方法:①采用一个系统默认的检验指标体系,以每一步λ统计量最小的进入判别函数,这样就能从整体上保证参数的合理性,计算的准确性也有了保证。②逐步判别停止的判据采用F值,当加入一个变量或者剔除一个变量后,对在判别函数中的变量进行方差分析,将因为变量的转换发生的系数变化统计下来,作为以后函数计算的重要数据。

③将获得的变量均值检验经过系统的分析,得出的结果作为费雪线性判别函数的系数。Fisher系数有被称为费雪线性判别函数的系数,在Fisher系数的系数表里,主要的指标要和变量均值检验表实现同步,这样在不断地分析计算过程中,才能得出Fisher线性判别函数模型。

由于模型中的6个变量从不同角度较好地反映了对于我国企业来说最重要的几个财务指标:盈利能力欠佳、资产周转速度慢, 尤其是应收账款回收慢,以及销售收入增长幅度小,经营现金流的短缺,这些都是极易导致财务危机的发生,最终影响企业生存的重要变量,通过这些数据的分析就能逐步实现财务危机的预警。

(三)主成分分析

在企业财务危机中,除了判别分析模型的建立之外,主成分分析也是较为普遍的方式。主成分分析主要是通过筛选和建立模型来实现,但是主成分分析法对于检测的指数和指标已经有了基本的规定,比如说企业重要的资金流动、盈利收益等,都是企业在财务危机预警里的主要成分。在变量较多的情况下,研究样本通常都比较复杂,因此需要利用主成分分析方法实施第二次筛选,使得模型精简化,这和判别分析的模型建立有同样的方法选择,选取适用的参数和指标来进行有针对性的研究。在企业财务危机分析中,具体是指,对企业收集的原始数据和财务指标进行标准化的处理,取平均为零,方差取1;然后,利用标准化的数据计算财务指标间相关系数矩阵R;最后,按照指标间的矩形计算规则,对于矩阵中的相关系数进行分析和计算。

三、多元统计分析对于企业财务危机预警的作用

本论文主要讨论了判别分析法和主成分分析法的使用,利用变量之间的关系通过函数建立企业财务危机预警模型。在企业财务危机预警的过程中,通过精确地数字来实现对于危机的提前处理,以数字化的指标来证明企业财务危机的可能性和危害性,为如何解决财务危机提供了方向性的指导。比如说,我们根据Fisher系数指标图看出,影响我国企业财务状况的指标主要是反映盈利能力的净资产收益率和资产净利率,反映资产管理能力的应收账款周转率和总资产周转率,反映成长能力的营业额收入增长率,反映获得现金能力的每股经营现金净流量,这几项数据在系数图里都能够看到,结合图示数据的分析,利用函数计算,就能有针对性的解决危机,减少危机的发生。

结语:本文主要针对企业财务危机预警中多元分析法的运用进行分析,借鉴前人的相关经验融合自己的想法与思路,对于应对企业财务危机提出自己的观点和建议。

参考文献

[1]李杰,王蔚佳,刘兴智.多元统计分析在企业财务危机预警中的应用[J].重庆建筑大学学报,2004(05).

第7篇:多元统计分析范文

【关键词】教学质量;评估;主成分分析

教学评价是系统地收集教学信息,基于所获得的信息,确定培养目标和要求对教学过程与结果进行衡量和价值判断,为教学决策提供依据,从而实现对教学活动的宏观调控,来达到预期结果的过程。对教师教学过程、教学水平进行科学合理的评价能够显示教师教学质量所达到的指标,亦能不断给对教学提供反馈信息。

根据学校的教师教学质量评价细则,调查了我校不同年级的部分学生。除去外出或拒绝回答等因素外实际调查人数153,应答率为85%。

主要是通过教学态度、教学技能、教学效果三方面来,确定了7个指标,公平对待每位学生鼓励学生对学习负责;上课准备充分、熟悉教学内容并注重课堂纪律;讲课条理清楚、层次分明、重点突出程度;积极开展教学改革不断改进教学;按要求完成教学任务,实际预期教学目标;学生能掌握或理解大部分教学内容;善于引导我们深入思考,课堂互动气氛浓厚,最后对教师的教学质量做一个总评价。教学质量评价(10分制):优秀:8.5分以上;良好:7.5分以上;合格:6.5分以上;基本合格:5.5分以上;不合格:5.5以下。

根据采集的100多份数据,利用excel录入数据,通过加权平均处理分析得到样本数据。论文根据多元统计分析建立了模型,应用了SAS软件和MATLAB神经网络环境分析处理。

在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

从上文中确定评价指标有7个,按顺序分别编为,代表学生对教师上课评价满意程度。我们将评价指标的取值范围定为[0,10],表格通过随机的153名同学评价,经过EXCEL处理得到数据,如表1所示。

将表1的组数据全部导入SAS中,调用主成分分析过程,编写程序如下:

提交运行,完成相关性分析。从结果中得到各个变量之间的相关性,如表2所示。

从表2中可以看出,于的相关关系最为显著,依次为0.6888,0.6550,0.5451,0.4496,0.4182。同时可以看到与的相关系数为0.6343;与的相关系数为0.6000。这些预测因子之间的相关系数较大,因此,需对预报因子做主成分分析,以提高评价准确性。

主成分分析将研究对象的多个相关变量指标化为少数几个不相关变量的一种多元统计方法,而且这些不相关的综合变量包含了原来变量提供的大部分信息。直接调用上面的SAS的主成分分析主程序,可以得到8个主成分的贡献率和累积贡献率如图1所示,同时可以得到其主成分的相关负荷表如图2所示。

从图1中可以看出前5个主成分的特征值的累积贡献率达到了91.18%,因此可以认为,用前面5个就足以获取原始数据的方差结构了。在看对主成分分析的解释,图2中给出了主成分与各变量的相关系数(即因子负荷)。从因子负荷中我们可以看到第一主成分中和的相关系数比较高;而在第二主成分明显的是由所支配的;同样可得到第三主成分是,第四主成分中和特征向量系数比较大,第五主成分中是。综述所述,可以得出特征性比较显著。

本文主要是对目前我院教学质量效果评价进行了研究。基于多元统计分析的教学质量评价,在主成分分析基础上建立教学质量评价模型。以主观评价试验和统计分析为基础,SAS和MATLAB为运行环境,得到结果。通过试验分析验证了该方法的可行性和有效性,完成了研究工作,并得出结果,即影响教学质量评价的主要因素和因素对教学质量评价影响程度。

参考文献

第8篇:多元统计分析范文

关键词:大学生就业模型 大学生起薪点 大学生就业率

近些年来,大学生就业问题成为了国内的热点问题,在中国国内生产总值逐年快速增长,提高平均国民素质的呼声越发高涨的环境下,不少大学成功实现扩招,但出乎意料的是,在看似有利于大学生发展的国内经济和政策下,却出现不少大学生难以就业,甚至出现“毕业等于失业”的势头。

目前关于研究中国大学生就业的文献,大多围绕着中国产业转型、大学生自身素质、高校人才培养结构等角度入手分析,本文章则主要从探求大学生的现实起薪点与GDP和大学生本科毕业生人数的联系,并调查大学生平均期望起薪点,比较大学生期望起薪点与现实起薪点,通过了解其差距的大小,归纳分析大学生期望起薪点对其就业行为的影响,对大学生的就业选择和行为提出建议,指导大学生建立合理的期望起薪点,降低其就业的苦难性,从而达到提高大学毕业生就业率的目的。

1.相关理论回顾

大学生严峻的就业情形已成为中国近年来的热点问题,最近,浙江工业大学理学院的周凯、吴婷、朱杭军、单莉丽几位学者,通过研究大学本科毕业生人数和国内生产总值对平均大学本科毕业生平均起薪点的影响和联系,建立了一个多维统计分析的大学生就业研究模型:

yn=c1×GDP■■+c2×GDP■■+c3×rn+c4

其中,yn为大学本科毕业生的起薪,GDP为当年的国内生产总值,rn为当年大学本科毕业生人数。

根据模型,有目的地收集相关的数据,如2004年~2010年国民生产总值、2004年~2010年大学本科毕业生的起薪点、2004年~2010年大学本科毕业生人数,整理和分析数据后,通过软件绘制出散点图,找出所求表达式的特性,拟合出数据图像,建立统计回归模型,得出具体表达式,预测得出2011年大学生平均起薪,并对此预测做出显著性评估。

2.模型的分析和预测结论

毕业生起薪点、毕业生人数、国内生产总值和年份数据查询如图1。

年份n与本科毕业生人数的曲线图如 图2所示。

年份n与国民生产总值GDP的曲线图如 图3所示。

根据图2和图3我们可以看出年份n与本科毕业生人数、年份n与国民生产总值GDP的线性关系,对于模型

yn=c1×GDP■■+c2×GDP■■+c3×rn+c4

通过R软件,我们输入数据发现得到以下结果:

Call:

lm(formula = y ~ x1^2 + x1 + x2, data = new)

Coefficients:

(Intercept) x1 x2

8.727e+02 3.999e-03 -9.133e-05

> summary(new1)

Call:

lm(formula = y ~ x1^2 + x1 + x2, data = new)

Residuals:

1 2 3 4 5 6 7

94.052 70.526 -155.134 -204.490 209.426 3.734 -18.114

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 8.727e+02 2.987e+02 2.922 0.0432 *

x1 3.999e-03 8.739e-04 4.576 0.0102 *

x2 -9.133e-05 1.518e-04 -0.602 0.5799

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

从以上各项系数的P值可得,当我们设定P值小于5%时为显著时,系数C4和X1(即国内生产总值)对模型影响较大,而系数X2(即毕业生人数)对模型影响较小,不显著。模型拟合效果可从以下结果得到:

Residual standard error: 176 on 4 degrees of freedom

Multiple R-squared: 0.8454, Adjusted R-squared: 0.7681

F-statistic: 10.94 on 2 and 4 DF, p-value: 0.0239上面的R可决系数和修改的R可决系数都比较大,接近于1,表明模型拟合的还不错。F检验也表明P值小于5%,模型显著。

另外当我们去掉C4时,模型的显著性结果如下:

Coefficients:

Estimate Std. Error t value Pr(>|t|)

x2 0.0001894 0.0001861 1.018 0.35545

x1 0.0052522 0.0012058 4.356 0.00732 **

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

从以上结果发现X1的P值见效了,显著性提高了。

Residual standard error: 278.7 on 5 degrees of freedom

Multiple R-squared: 0.9832, Adjusted R-squared: 0.9765

F-statistic: 146.4 on 2 and 5 DF, p-value: 3.652e-05以上的可决系数、修正的可决系数都变大了,而且F检验的P值见效了,由此可见模型的拟合程度也提高了,起薪点拟合数据和拟合图如图4和图5所示:

根据模型的拟合,我们可以估算出2011年本科毕业生人数和国民生产总值GDP(如图6):

进而进一步估算出2011年本科毕业生的起薪点为2583.378元。

3.应届本科毕业生平均期望起薪点和实际平均起薪点对比结论

根据德国著名的调研机构trendence与GTI Media联合一项调研结果,调查始于2010年9月份,对象为大三、大四学生、研究生以及毕业不足一年的毕业生。报告重点调研了2010年中国毕业生对于第一份职业工资的预期,称每月工资期望值为4379.5元,男生为4700元,女生则为4100元。

根据多元统计分析的大学生就业模型预测,2011年的本科毕业生平均起薪仅为2583.378元,由此对比可知,中国应届本科毕业生平均期望起薪点和实际平均起薪点相距较大。

根据以上结论,我们可以得出,中国应届毕业生在寻找工作时,会出现“高不成,低不就”的现象,期望起薪点与实际相距过大,导致大学生在本来严峻的就业形势中,给自己再增添了一道栅栏。

我国目前现状是,GDP每年快速增长,但产业转型始终未完成,我国还处于以劳动密集型为基础的产业结构,因此,企业对大学生的需要虽然持续增加,但始终跟不上高校扩招的速度。从1999年实现的高校扩招,毕业生人数每年以60~70万增加。

并且,随着国内物价的上涨,我认为,应届毕业生的期望起薪点将不断提高,实际起薪点和期望起薪点差距的进一步拉大,将导致越来越多的大学生难以与企业正式签约,应届毕业生就业率下降。

4.根据结论得出的提高应届毕业生就业率的几点建议

4.1从多元统计分析的大学生就业模型中我们可以得知,应届大学毕业生的实际起薪点与国内生产总值和应届大学毕业生人数相关,因此,我认为,大学生应在制定期望的起薪点时,应参考当年的国内生产总值和应届大学生毕业人数,通过详细分析数据后,再得出合理的起薪点,这将有利于应届毕业生在寻找工作时不会因过高期望的起薪点而失去良好的就业机会,从而增加应届毕业生的就业率。

4.2大学生在寻找工作的过程中,不妨先在低起薪点的职位就业。根据调查显示,大学毕业生在就业10内薪酬提升速度远高于没有就读大学的人,因此,在一个低起薪点的职位开始,有利于大学生先解决就业这一燃眉之急的问题,保证自己的生活所需,并且,从基层做起,有利于大学生更好地做到理论和实践结合,深入了解自己所就任的职位技能和企业架构,为将来大学生的职位升迁奠定了扎实的基础。

4.3政府应颁布一些政策保障物价的稳定。应届大学毕业生期望起薪点地快速提升,有相当一部分源自于我国目前持续高涨的物价水平,倘若政府再不及时颁布稳定物价的政策,将会导致应届毕业生的期望起薪点与现实完全脱节,从而导致企业招不到合适的人材,大量岗位空缺,大学生也找不到合适的工作,应届毕业生失业率上升,企业利润下降等不利情况的发生。

4.4大学生可转变思维,变就业为创业,近些年来,政府对大学生创业颁布了许多优惠政策,大学生创业环境的改善,将有利于激发大学生的自主创新精神,但我国大学生普遍的创业意识较薄弱。因此学校应当在常规教育中向学生渗透相关的市场信息,及相关融资、法律等知识,并通过开设专门的创业课程,解剖案例,让学生慢慢树立起自主创业的意识与信心。

5.展望

本文基于大量的调查数据分析,根据模型的求解预测出实际本科毕业生平均起薪点,通过与现实应届毕业生的期望起薪点的对比,从而发现应届毕业生关于起薪点的期望值和实际值的脱节将会恶化大学生的就业环境,为此,我提出了缓解这一现象的几点建议,本案例的调查研究将有利于大学生更透彻地了解自身所处的就业环境和指导大学生合理的就业计划制定,从而有效提高应届毕业生的就业率。

我认为,在进一步分析中,我们可以从本模型研究出发,深入分析全国各地不同城市的起薪点和大学生就业率,从而为指导大学生流向需要的城市和地区,有效地进行全国各地大学生人才分配和流动,从而为保障大学生就业,平衡这个国家人才分配,促进全国各地经济的协调发展起到积极的作用。

参考文献:

[1]周凯、吴婷、朱杭军、单莉丽.《基于多元统计分析的大学生就业模型研究》

[2]厦门人才网《2011大学生入职期望工资》

第9篇:多元统计分析范文

关键词:多元智能算法;智能处理技术;神经元网络技术;差分嵌入编程技术;数据挖掘技术

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2012)29-6996-04

“三流的企业卖产品,二流的企业卖技术,一流的企业卖标准”,这句话形象地概括出了标准在企业竞争中的决定性作用。放眼当今世界,凡是标准领先的企业,无一不在该行业中居于主导地位,决定着行业的进入壁垒或者发展趋向。企业标准信息的存贮、处理及应用已越来越广泛。“多元企业标准数据处理分析编写系统的开发设计”企业标准编写系统能更进一步对各类标准数据进行综合分析与优化处理研究应用。本系统是基本于woindows操作下的具有三层架构的应用程序,具有开放的用户层、应用层、数据层,并为设计、开发、集成和部署软件平台应用提供基于组件的方法。系统应用又与access数据库、word系统、其它出版系统等构成多元化集成系统平台,它具有应用程序调度与管理功能、系统安全管理功能、资源程序分配管理、功能业务流程制订与管理功能、流程追踪与记忆管理功能、数据挖掘功能、多架构平台集成算法先进等功能。这是一套集管理技术、格式化文档处理、多项算法技术、海量级数据处理技术于一体的应用开发系统。在石油生产科研中必将起到积极的作用和得到广泛的应用,也必将创造更大的经济效益和社会效益。

1 数据处理算法研究

随着人工智能科学的深入发展,对智能控制的研究已演变成多元层次、树层次与子层次递阶控制的模式。有学者将遗传算法与人工神经元网络算法结合,分别提出了“基于人工神经元网络的遗传算子自学习”和“基于权值进化的人工神经元网络”的思想体系。也有学者对遗传算法、人工神经元网络算法和免疫算法三者的集成进行了研究。其主要的思想是对外界环境学习、自适应功能由人工神经元网络算法完成,算法参数的调节、升级功能由遗传算法完成,算法对环境适应性的评价由免疫算法完成。智能算法的多元化意味着算法复杂度的上升,同时也意味着编程难度和软件潜在故障率的上升。是否采用多元智能算法及如何采用多元智能算法,需要根据系统性能要求和设计精度进行相关的评估。

1.1 多元算法的研究

多元算法已经成为当前数据挖掘技术和数据处理中重要的方法之一,而求解多元算法模型的关键问题是如何确定回归系数和模糊测度。针对以往使用遗传算法确定回归系数和模糊测度时间复杂度高和收敛速度较慢的问题,使用一种高效的搜索算法——粒子群算法求解基于广义Choquet-积分的多元非线性回归模型,分别在人工数据和真实数据上进行实验,对粒子群算法和遗传算法进行比较.结果表明,用粒子群算法求解该模型不仅比遗传算法收敛速度快,而且还能搜索到比遗传算法更优的解。

1.2 数据流工程正则算法的研究

数据流工程正则算法的研究以形式化的方法研究数据流分析的基本原理,给出了数据流表达式的概念。并在此概念的基础上,研制出一个数据流异常的数据流分析算法。算法要求通用性强,运用本算法不难开发出相应的程序,根据标准工程的特点研发“正则集的代数”算法并形成表达式,进而完成编写代码。

正则集的代数”算法格式如/abc/,其中位于“/”定界符之间的部分就是将要在目标对象中进行匹配的模式。用户只要把希望查找匹配对象的模式内容放入“/”定界符之间即可。为了能够使用户更加灵活的定制模式内容,正则表达式提供了专门的“元字符”。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。

较为常用的元字符包括: “+”, “*”,以及 “?”。其中,“+”元字符规定其前导字符必须在目标对象中连续出现一次或多次,“*”元字符规定其前导字符必须在目标对象中出现零次或连续多次,而“?”元字符规定其前导对象必须在目标对象中连续出现零次或一次。这也是项目的创新点。

1.3 标准工程算法

主要研制出符合标准化GB/T 1.1-2009要求的工程算法及20多个重点子算法。如:GB/T 321 优先数和优先数系及ISO 图形算法。通过国标规定,建立数据库,然后通过数据挖掘技术方法建立研究算法,然后依数据分析技术建立数据模型,最后完成算法代码。标准工程用到的数据挖掘技术算法(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、事先不知道的、但又是潜在有用的信息和知识的过程。嵌入式线性算法技术主要用在数据处理、解释、结果呈现上面。

2 建立多元企业标准数据处理分析编写系统的开发设计

2.2系统的安全设计

本集成系统平台具有功能完善的信息交换式管理界面(如图1所示),安全的系统嵌入式接口和强壮的用户管理,整个软件系统是一个完整的统一整体平台,密不可分。使用加强的MD5口令算法加密,各模块之间紧密集成与子程间具有防拷贝功能。

2.3系统的功能设计

3 结束语

“多元企业标准数据处理分析编写系统的开发设计”的软件设计规范, 操作简单灵活, 适应性强, 易学易用。它是由系统平台管理模块、数据库管理模块、标准编写起草模块、标准编写修改模块、标准编写标准生成模块、与word集成模块、Windows API控制模块、数据导出模块、数据导入模块、内存优化管理模块及众多算法模块有机地集成在一起而成的综合系统。它具有程序设计算法的创新性及国际软件编程的先进理念,软件投入使用可减轻企业标准制定者的疲劳强度及软件学习的效率,提高企业标准编写质量及标准制定的工作效率。软件的推广使用,得到了企业标准制定人员的良好应用与用户好评,在石油行业企业标准制定中,获得良好的工作效率、经济效益和社会效益,为整个石油行业生产质量节能工作做出贡献。

参考文献:

[1] 马有志.钻井多元数据分析处理系统的开发设计[J].计算机应用研究,2008(25):2005.