研究聚类分析的甘肃省工业行业结构

作为一种常用的多元统计方法,聚类分析从数据分析的角度,使同一分类过程中有了一个统一性的定量标准,避免了一般定性分类中的主观性和随意性的弊端,从而在经济学研究中也得到了广泛的应用。以下是由查字典范文大全为大家整理的研究聚类分析的甘肃省工业行业结构,希望对你有帮助,如果你喜欢,请继续关注查字典范文大全。

关键词:因子分析;聚类分析;甘肃省;工业行业结构

摘 要:一般的聚类分析方法的应用,在确定指标体系的同时,忽视了指标间相关性及权重问题的存在,论文拟结合因子分析法来进行聚类分析,以解决相关性和权重分配的问题。同时,本文利用基于因子分析的层次聚类分析法来对甘肃省工业行业结构进行研究,将甘肃省工业行业划分为4类,并根据4类行业的指标数据得分指出其行业结构存在的特点及相应问题。

一、引言

聚类分析是研究指标(或样品)分类问题的一类多元统计分析方法的总称,其中心思想是将一些相似度较大的指标(或样品)聚合为一类,同时把另外一些相似度较大的指标(或样品)聚合为其他的类,然后再将这些小类依据其相似度聚合为一个大类,直至所有的指标(或样品)都聚合完毕,以更直观的显示出研究对象的差异和联系。

作为一种常用的多元统计方法,聚类分析从数据分析的角度,使同一分类过程中有了一个统一性的定量标准,避免了一般定性分类中的主观性和随意性的弊端,从而在经济学研究中也得到了广泛的应用。例如,聚类分析法曾用于区域经济结构的分析(王强 2004),也曾有学者将聚类分析应用于城市竞争力的研究与比较(倪鹏飞 2003,吴庆军 2005),也有一些学者将聚类分析应用于可持续发展模式研究(张德平 2003),在产业结构方面,许多学者也曾经应用聚类分析法做了很多富有成效的研究工作,如:有学者应用聚类分析法研究了重庆市的产业结构(张春勋 2004),而灰色聚类分析法曾用于确定区域工业支柱产业(李胜 2000),在工业结构方面也有人应用聚类分析方法得过一定的研究成果(吴海建 2004),这些聚类方法的应用为分析研究对象提供了一个良好的途径。

传统的聚类方法的应用,一般要对所选用的原始数据首先进行定性分析,然后将原始数据进行无量纲化的处理,而后再利用具体的方法对相似性进行测度。如果采用层次聚类法我们还面临着求取新类相似性的问题,计算新类与其它类之间的相似性,然后依相似程度远近逐次进行合并,最终得出聚类结果。我们在传统聚类方法中虽然解决了原始数据的量纲和量级问题,但是单一的聚类分析法也存在着一定的缺点,由于聚类分析首先是一种定量的分析方法,而我们所选定的指标又有可能存在着相互关联的问题,即相关性问题,而采用这种具有相关性的指标就可能使分析结果产生偏差;从另一个方面来看,这种定量方法也忽略了指标间权重的问题,所以,如何减少各个指标之间的相关度,并分配给各个指标以科学合理的权重,同时又不损害聚类结构的精确度就成为聚类方法应用的一个亟待解决的问题。

因子分析起源于20世纪早期,其基本思想是通过研究众多变量之间的内部依赖关系,需求这些数据的基本结构,并用少数几个公因子来表示基本数据结构,使其既能够反映原来众多指标变量所代表的主要信息,同时又能够简化数据结构(侯景新 2004),使简化后的数据之间的相关性问题得以解决,从而达到方便研究的目的,因此,在聚类分析中结合因子分析就可以有效地减少各个指标之间的相关性问题。本文拟在聚类分析法中应用因子分析法以祛除指标之间的相关性,主要结合对甘肃省工业行业结构实证研究来探讨对这一方法的应用。

二、甘肃工业行业结构实证研究

甘肃省工业体系主要形成于前两个“五年”计划及国家“三线”建设时期,半个多世纪以来,甘肃工业取得了长足的进步,2005年实现工业增加值685.80亿元,工业贡献率达到42.21%。与此同时,甘肃省工业发展中也存在着严重的缺憾和扭曲,其中最突出的表现就是工业结构的不合理。党的十六大提出要“坚持以信息化带动工业化,以信息化促进工业化,走出一条科技含量高、经济效益好、资源消耗低、环境污染少、人力资源优势得到充分发挥的新型工业化道路。”因此,要完成新型工业化的任务,就要对甘肃省目前不合理的工业结构进行改善和优化,使工业对甘肃省经济发展发挥更大的作用,就成为甘肃经济发展中一个紧迫的问题。工业行业结构是工业结构中的主体部分,优化工业结构的重点就是对工业行业结构进行优化和升级,在这种情况下,对工业行业结构的特征进行认识、分析和研究就显得尤为重要,全面而准确的认识到甘肃省工业行业结构的特征,才能够有的放矢,有针对性地提出优化和升级甘肃省工业结构的具体方法。多年来,省内外许多学者也对甘肃省工业行业结构进行了分析,提出了不少有建设性的建议,如从产业技术战略和产权制度等方面来对工业行业结构进行优化(张克让 2001);从行业的区域布局结构来对工业行业结构进行调整(倪国良 2002);提出发挥情报信息对调整工业行业结构的推动作用(白蒲英 2005)等等。但是综观这些研究成果可以发现,他们对甘肃省工业行业结构的分析大多数是基于定性的观察和思考,而这种分析往往容易产生主观性的偏差,缺乏对研究对象的定量认识,因此,有必要采用一种合理的定量分析方法来分析和研究甘肃省的工业行业结构。

本文在应用聚类分析的时候加入了因子分析方法以驱除各指标之间的相关性及权重问题,总的原则是在选取指标进行聚类分析前,首先对指标运用因子分析方法进行处理,并运用处理过的公因子指标进行聚类分析,其过程如下:

1. 指标选取

指标的选择是一个至关重要的前提性工作,既要结合研究目的,也要考虑指标数据的可得性,同时也要满足科学性和全面性的要求。按照这一要求,我们选取了2006年《甘肃年鉴》中除“其他采矿业”、“化学纤维制造业”、“橡胶制造业”、“废弃资源和废旧材料回收加工业” 以外的甘肃省全部国有及限额以上非国有工业企业的以下指标构成指标体系:X1工业增加值、X2全部从业人员年平均人数、X3年末资产合计、X4产品销售收入、X5产品销售费用、X6利税总额、X7总资产贡献率、X8资产负债率、X9流动资产周转次数、X10工业成本费用利润率、X11全员劳动生产率、X12产品销售率等12项指标组成指标体系。所选取的指标包括了工业行业规模、效益、就业等主要方面,能够反映甘肃省工业行业的基本信息。

2.因子分析过程

因子分析的基本思路为:

(1) 根据相关数据建立原始矩阵,并对原始数据的标准化处理;

(2) 对数据间的相关性进行计算,确定是否可以运用因子分析;

(3) 运用主成分法对经标准化处理后得矩阵进行初始因子求解,确定公因子数目;

(4) 运用Varimax旋转法对初始因子进行旋转,给予明确得因子解释;

(5) 计算因子得分。

运行spss13.0 for windows,标准化数据(系统自动进行)后选择KMO and Bartlett’s test of sphericity 计算相关性,随后选择Principal components(主成分分析)进行初始因子求解, Varimax(正交旋转)进行因子旋转。

经计算,原始矩阵的KMO值为0.628,说明该指标矩阵适合于进行因子分析。对经过处理后的数据进行因子分析共提取了3个公因子,其特征值、贡献率、累积贡献率及旋转后的因子载荷矩阵如表1、表2所示:

表1:公因子相关数据表

公因子 特征值 贡献率% 累积贡献率

F1 5.075 37.542 37.542

F2 3.734 35.353 72.895

F3 1.159 10.180 83.075

表2:旋转后因子载荷矩阵

F1 F2 F3

X1 0.966 0.188 -0.009

X2 0.980 -0.030 -0.001

X3 0.948 0.119 -0.057

X4 0.968 0.094 0.022

X5 0.766 -0.022 -0.161

X6 0.354 0.768 -0.105

X7 -0.093 0.922 0.000

X8 0.071 -0.565 -0.594

X9 0.205 0.855 0.098

X10 -0.031 0.930 0.053

X11 0.055 0.903 -0.026

X12 -0.074 -0.106 0.903

通过分析可以看出,3个公因子的累积贡献率已经达到83.075%,可以较为全面的反映整体情况,因此,我们就可以用这3个公因子来取代上述的12个指标来对甘肃省工业行业结构进行分析。从表2可以看出,公因子F1在X1、 X2、 X3、 X4、 X5上承担了较大的载荷,它们主要是行业规模方面的指标,因此,公因子F1可以定义为规模因子;公因子F2在X6、X7、X9、X10、X11上承担了较大的载荷,它们主要是行业效益方面的指标,因此,公因子F2可以定义为效益因子;公因子F3所承担的载荷主要集中于X12即产品销售率,反映了行业风险方面的信息,因此,公因子F3可以定义为风险因子;同时,根据表2中的数据,就可以分别求出甘肃省35个工业行业的4个公因子的得分数值,如F1的计算公式如下:

F1=0.966X1+0.980X2+0.948X3+0.968X4+0.766X5+0.354X6-0.098X7+0.071X8+0.205 X9-0.031 X10+0.055 X11-0.074 X12

3.聚类分析过程

通过因子分析过程,得到了甘肃省36个工业行业的3个公因子,这3个公因子之间已经驱除了相关性问题,同时,按照它们的贡献率的不同,使3个公因子被赋予了各自的权重。如上所示,我们将得到的这36个工业行业的3个公因子的得分值作为指标对甘肃省的工业行业进行层次聚类处理,以探测出甘肃省工业行业内部结构的趋同性和差异性,按照规模、效益和风险来对其进行剖析,这一过程同样使用统计软件spss13.0 for windows来进行。

运行spss13.0 for windows,分别选用平方欧式距离对相似性进行测度;组间连接法求新类相似性,可以得出最终的聚类结果。通过聚类分析,我们可以把甘肃省的36个工业行业按照其公因子的总得分将其分为3类(表3)。

表3:甘肃省工业行业聚类结果表

第一类 石油加工、炼焦及核燃料加工业;黑色金属冶炼及压延加工业;

有色金属冶炼及压延加工业;电力、热力的生产和供应业

第二类 石油和天然气开采业;烟草制品业

第三类 其他29类工业行业

注:因子分析及聚类分析数据来源均为2006年《甘肃年鉴》

4、对聚类结果的分析

从聚类结果可以看出,处于第一类的石油加工、有色金属冶炼及压延加工业等行业在甘肃工业中无疑处于绝对的支柱产业的地位,2005 年,全部国有及限额以上非国有工业企业工业增加值中,这四个行业占据了57.18%的份额,可以说,它们是甘肃工业的大半壁江山,甘肃工业的发展,它们功不可没。但是如果从效益指标来看,这四类行业的经济效益却不容乐观。公因子F2反映的主要是行业效益方面的信息,但在F2载荷较大的利税总额、总资产贡献率、流动资产周转次数、全员劳动生产率、工业成本费用利润率几个指标来看,除黑色金属冶炼及加工业和电力、热水的生产和供应业以外,表现都不尽如人意,而电力、热水的生产和供应业的相对高效益还得益于其产品对于满足生产生活的必要性及其垄断性。公因子F3主要反映了行业产品的销售情况,通过这一指标也可以了解到其产品面临的销售风险,从几类行业的表现来看,销售情况比较良好,这应该归结于几类行业的资源型产品性质,同时,行业的垄断性也占据着较大的因素。因此,从整体上来看,目前甘肃工业的发展还必须牢牢依靠这四类工业行业的发展,但是,由于这四类行业普遍具有的资源型特征,今后甘肃必须面对资源耗竭过程中如何转变支柱产业方向,培育新的支柱产业这一严峻的问题。

第二类烟草制造业、石油和天然气开采业可以归类为甘肃省工业中的主导产业,2005年,全部国有及限额以上非国有工业企业工业增加值中,这两个行业占据了9.39%的份额,成为甘肃工业发展的重要增长点。从效益指标来看,这两类行业尤其是石油和天然气开采业表现都令人满意,无论是总资产贡献率、资产负债率还是全员劳动生产率,两个行业的综合效益指标表现在全部工业行业中都处于领先位置。而从销售风险指标考虑,它们的表现也让人满意。因此,对于这两个行业,在今后可以考虑进一步培育,使他们发展更加壮大。

第三类行业在甘肃工业中总共占据了33.43%的份额,相对规模比较小,但是,这类行业中也不乏效益和风险指标都比较好的行业,同时,这些行业中轻工业和高新技术工业行业占据了不小的份额,因此,甘肃省工业结构的调整和优化,它们是不可忽视的力量,培育甘肃工业经济新的增长点,必须着重从这一类行中的入手。

三、小 结

运用基于因子分析的聚类分析方法,我们将甘肃省工业行业分为3类,对这一结果进行分析可以看出甘肃省工业行业结构所表现出来的一些特点与存在的问题:

1.多年来“重重轻轻”的工业结构仍未有根本改观,轻重工业发展仍不协调

轻重工业发展不协调的问题是甘肃省工业一贯有之的问题,它起因于“三线”建设时期国家的产业布局,改革开放以来,轻重工业协调发展问题一直是甘肃省工业结构调整的首要问题,然而,经过二十多年的发展,这一问题反而有加剧的趋势,1978年,甘肃省轻重工业的比例为1:4.35, 2005年这一比例为1:6.23,同时,从聚类结果可以看出,构成甘肃省工业中支柱或主导产业的六种行业中,绝大多数是重工业行业,虽然它一定程度上表现了甘肃的相对比较优势,但同时,由于这些重工业资源型的特点,使其无法应付资源耗竭的困境,缺乏可持续发展的能力。今后甘肃工业轻重协调发展问题仍然需要付出巨大的努力去解决。

2.国有经济比重仍然过大,市场化进程缓慢

从聚类结果来看,占据甘肃工业大半壁江山的支柱和主导产业绝大部分是重工业,而同时,它们又都是以国有或国有控股性质为主,因此,造成甘肃省工业经济呈现出明显的国有化特点,2005年,甘肃省全部国有及国有控股工业企业产值占到了全省工业总产值的69.15%,。由于国有及国有控股工业企业占据了全省工业的绝大多数份额,更由于它们更容易掌握较优质的发展资源,造成甘肃市场化进程缓慢,使非公有制经济发展空间受到挤占,比重过小,活力不足,这就使全省工业结构调整和经济发展受到一定程度的制约,进度较慢。

以上是由查字典范文大全为大家整理的研究聚类分析的甘肃省工业行业结构,希望对你有帮助,如果你喜欢,请继续关注查字典范文大全。