Economics 版 (精华区)


 
聚类分析在股票市场板块分析中的应用 
发布时间:2000年10月02日 
邓秀勤 
  摘 要 邓秀勤.聚类分析在股票市场板块分析中的应用.
  本文将聚类分析应用于股票市场的研究,研究实例表明,聚类分析方法是股市板块分
析中的一种有效、实用的方法。
  关键词:聚类分析,板块,投资,系统聚类
  中图分类号:O212 F830.9    文献标识码:A
Application of Cluster analysis in stock market board analysis
DENG Xiu-qin
(Dept.of Computer,Shaoguan University,512005)
  Abstract The cluster analysis has been applied in study of stock market.I
t point out that cluster analysis is an effective and practical way in stock m
arket analysis.
  Key words:Cluster Analysis;Board;Investment;System.
一、问题的提出
  随着我国市场经济建设的高速发展,人们的金融意识和投资意识日益增强,而作为市
场经济的组成部分—股票市场,正逐步走向成熟与规范,越来越多的投资者把眼光投向了
股票,历史已经证明股票是一种不仅在过去已提供了投资者可观的长期利益,并且在将来
也将提供良好机遇的投资媒体。然而,股价涨跌无常,股市变幻莫测,投资者要想在股市
投资中赢取丰厚的投资回报,成为一个成功的投资者,就得认真研究上市公司的历史、业
绩和发展前景,详细分析上市公司的财务状况,树立以基本分析为主,技术分析为辅的投
资理念,找出真正具有投资价值的股票,进行长期投资。 
  股票投资的基本分析分为宏观分析、中观分析、微观分析三大部分,宏观分析指对国
家的国民经济以及政治、文化的分析,微观分析指公司分析,而中观分析主要指行业分析
和地区分析等,板块分析主要归属于中观分析,兼有微观分析。中国股市从无到有,发展
至今已颇具规模,前些年,在中国股市发展的初生阶段,由于市场规模小,上市公司数量
不多,加上股民的投资思维和操作方法不太成熟,因此,投机性特强,这时用不上多少板
块分析。但是,随着股市发展、投资手法和证券监管方法的成熟,以及上市公司数量的不
断增多,如果再和以往一样,面对上千种股票胡乱抓一气,碰运气,甚至受各种股评和谣
言所左右,则很难走向理性化,进而难以最终取得投资成功。因此,在成熟股市中,一个
股民若想成功,必须学会板块分析,习惯理性操作,树立板块投资理念。 
  板块是指具有共同特征的股票群。股市中的板块可以行业和产业、地域、时间、特殊
题材等多种角度来划分,而在每一板块中又有几十种甚至上百种股票。面对众多股票及每
个公司的众多财务数据,怎样才能客观、全面、准确地分析并选出各板块及板块内的绩优
龙头股和潜力股呢?笔者用多元统计分析中的聚类分析方法,对此问题作一些探讨。
二、聚类分析在股市板块分析中的应用
  系统聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度
并类,并计算新类与其它类之间的距离,再选择相近者并类,每合并一次减少一类,继续
这一过程,直到所有样本都并成一类为止。在聚类过程中,我们选用欧氏距离来度量类与
类之间的相似程度,聚类方法采用类平均法。
  我们以高科技板块中的31个上市公司为研究对象,分析中选取了这31个上市公司1997
年的每股收益、每股净资产、股东权益率、净资产收益率、净利润率等五个反映上市公司
综合盈利能力的指标,数据取自[4](略)。应用SAS软件中的系统聚类过程CLUSTER对31个
样本进行聚类,得到表1所示的聚类过程。表1中NCL为聚类数;Clusters Joined为每次聚
成一个新类的2个样品(标有OB)或旧类(标有CL);FREQ为新类中所含有的样品数;SPRSQ为
半偏R2,它表示每一次合并对信息的损失程度,看这一列的数值可知:从4类合并成3类时
信息损失(为0.1042)最多,此统计量表明聚成4类较合适;CCC在NCL=4时达到唯一的峰值-
2.49,它支持分4类;PSF为伪F统计量,PSF出现峰值时所对应的分类数较合适,从这一列
的数值可知PSF在NCL=17、NCL=12、NCL=9和NCL=4时4次达到峰值,但在NCL=4时峰更陡些;
PST2为t2统计量,PST2出现峰值的前一行所对应的分类数较合适,从这一列的数值可知NC
L=3时出现峰值9.8,它也支持分4类。综合这四个统计量可知:将31个样本分成4类较合适
。根据表1,作出图1所示的聚类谱系图。当我们取分类阀值为1.0时,31个样本被分成了四
类,各类包含的样本如下:
表1 系统聚类过程
NCL Clusters Joined FREQ SPRSQ CCC PSF PST2 DIST 
30 OB2 OB19 2 0.0018 . 19.0 . 0.2330 
29 OB16 OB30 2 0.0026 . 16.1 . 0.2792 
28 OB9 OB23 2 0.0026 . 15.7 . 0.2804 
27 OB25 OB27 2 0.0027 . 15.7 . 0.2839 
26 OB6 OB28 2 0.0041 . 14.3 . 0.3516 
25 CL30 OB20 3 0.0056 . 12.6 3.1 0.3751 
24 OB3 CL27 3 0.0058 . 11.7 2.2 0.3880 
23 OB1 OB26 2 0.0063 . 11.2 . 0.4340 
22 CL25 CL28 5 0.0116 . 9.5 3.4 0.4492 
21 OB17 OB31 2 0.0070 . 9.5 . 0.4599 
20 CL24 OB5 4 0.0087 . 9.2 2.1 0.4654 
19 OB10 OB15 2 0.0075 . 9.4 . 0.4744 
18 OB4 OB8 2 0.0082 . 9.5 . 0.4952 
17 OB11 OB21 2 0.0082 . 9.7 . 0.4965 
16 CL26 CL29 4 0.0133 . 9.4 4.0 0.4998 
15 CL20 OB7 5 0.0111 . 9.5 1.9 0.5228 
14 CL23 CL18 4 0.0143 . 9.5 2.0 0.5680 
13 OB14 CL21 3 0.0129 . 9.7 1.8 0.5857 
12 OB13 OB24 2 0.0141 . 9.9 . 0.6512 
11 CL22 CL16 9 0.0427 . 8.5 7.2 0.6546 
10 OB12 CL13 4 0.0185 . 8.8 1.9 0.6848 
9 CL19 OB22 3 0.0224 . 9.1 3.0 0.7485 
8 CL11 CL15 14 0.0868 . 7.0 9.2 0.7943 
7 OB18 OB29 2 0.0213 . 7.8 . 0.7989 
6 CL14 CL17 6 0.0492 -3.12 7.8 5.3 0.8501 
5 CL8 CL12 16 0.0573 -2.85 8.0 3.8 0.9007 
4 CL9 CL10 7 0.0703 -2.49 8.4 5.1 0.9533 
3 CL6 CL5 22 0.1745 -3.55 6.2 9.8 1.0341 
2 CL3 CL4 29 0.1656 -3.49 4.8 6.7 1.0618 
1 CL2 CL7 31 0.1428 -0.00 . 4.8 1.3179 
 
图1 样本聚类分析的动态过程
  第一类:OB18(天津磁卡),OB29(燕化高新);
  第二类:OB22(深科技),OB15(实达电脑),OB10(清华同方),OB12(东大阿派),OB14
(长城电脑),OB31(风华高科),OB17(东方通信);
  第三类:OB1(华光科技),OB26(佛山照明),OB4(国脉通信),OB8(工大高新),OB11(
振华科技),OB21(彩虹股份);
  第四类:OB2(冰箱压缩),OB19(同济科技),OB20(华东电脑),OB9(长安信息),OB23
(中科健),OB16(湘计算机),OB30(倍特高新),OB6(南华西),OB28(深圳华强),OB7(厦门
信达),OB25(华意压缩),OB27(粤TCL),OB3(复华实业),OB5(南洋实业),OB13(中国高新
),OB24(深华源)。
  第一、二类公司在经营规模、经营实力、技术水平等方面具有一定优势,竟争能力强
,经营业绩优良,综合财务状况良好,属高科技板块的绩优龙头股,颇具发展潜力和长期
投资价值,是高科技板块中投资者的首选投资对象。其中第一类的天津磁卡、燕化高新19
97年净利润率分别为45.86%和44.32%,净利润增长率分别是93.6%和96.95%,其获利能力远
远大于其它公司。第四类公司业绩一般,投资者应谨慎介入,可多加观望。
三、结束语
  聚类分析能综合多项财务指标来反映上市公司的盈利能力和水平,所得聚类结果与公
司的实际财务状况和经营状况相吻合。我们还可以对所选出的各个板块的龙头潜力股再进
行聚类分析,找出最具实力的板块龙头股。
作者单位:邓秀勤(广东韶关大学计算机系,韶关,512005)
参考文献
[1] 何剑著(1997),《深沪股市板块分析》,广州出版社,广州.
[2] 武冠卓等编著(1997),《深沪股市公司分析》,广州出版社,广州.
[3] 方开泰(1989),《实用多元统计分析》,华东师范大学出版社,北京.
[4] 信息早报社编(1998),《98选股投资手册:上市公司97年报大全》,中国档案出版
社,北京.
[5] 胡良平主编(1996),《现代统计学与SAS应用》,军事医学科学出版社,北京.
[6] 高惠璇等编(1995),《SAS系统与基础统计分析》,北京大学出版社,北京.
 
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:5.433毫秒