简体版  |  繁体版   推荐信息: 随心所欲发新闻 人气资源一网拢尽 | 免费获取比特网通栏广告位
企业软件

挖掘上市公司财务风险 分析股市数据模型

出处:绵阳日报 作者:郑斌祥 郑刚 龚婷 2005-07-12 10:47 评论
字体大小: | |
对于股民而言,如何寻找股市黑马,是他们最关心的问题。不过,更重要的却是,如何通过上市企业的财务报表,进一步判断该企业的财务风险?

  对于股民而言,如何寻找股市黑马,是他们最关心的问题。不过,更重要的却是,如何通过上市企业的财务报表,进一步判断该企业的财务风险?对于证券公司而言,更是如此。从企业财务报表数据入手,应用数据挖掘研究方法,构建上市公司财务风险预警数学模型,借助模型研究及实证分析,客观评判并预测证券市场可能出现财务风险的上市公司。这正是商业智能的价值所在。

  如何客观评价上市公司财务状况,尤其是预测可能出现财务风险的公司,对于投资者及时调整投资决策、监管层准确识别盲目融资公司,以及投资银行有效发掘潜在客户都具有重要意义。

  上市公司财务风险是上市公司的一个最重要的事件,特别是当上市公司显示出不健康的症状之时。财务风险的终极表现就是公司破产,公司无能力履行偿还所负债务的责任,比如偿还贷款或支付商业合同的款项。一个健康良好的金融市场的主要目标就是减少公司破产事件和保持一个良好活跃的经济循环环境。

  应用数据挖掘研究方法,构建中国上市公司财务风险模型,对于客观评判并预测我国证券市场可能出现财务风险的上市公司,这是一件非常有意义的事情。

  数据挖掘预测模型

  采用数据挖掘算法建立的上市公司财务风险预测模型,主要包括决策树法、神经网络法和逻辑回归法。

  决策树模型

  决策树也称为判定树。在决策树方法中,首先从实例集中构造决策树,这是一种有指导的学习方法。该方法先根据训练集数据形成决策树。决策树代表着决策集的树形结构。最终结果是一颗树,其叶结点是类名,中间结点是带有分支的属性,该分支对应该属性的某一可能值。

  决策树技术发现数据模式和规则的核心是归纳算法。归纳推理从若干个事实中表征出的特征、特性或属性中,通过比较、总结、概括而得出一个规律性的结论。归纳推理试图从对象的一部分或整体的特定观测中得到一个完备且正确的描述,即从特殊事实得出普遍规律性的结论。

  神经网络模型

  神经网络是模拟人脑结构的数据模型,因此,神经网络是一个具有自我学习能力的系统。象大脑一样,神经网络从一组输入数据中进行学习,根据这一新的认知调整模型参数,以发现数据中的模式。因此神经网络的工作过程可以分为两个阶段。

  学习阶段:对网络进行训练,主要是调整网络神经元间的连接权值和连接方式等。神经网络的信息处理能力主要由连接方式和连接权值决定。因为神经网络的信息处理能力主要通过学习阶段获取,并影响整个工作阶段,所以神经网络的神经元间的连接方式和连接权值又称为长期记忆。虽然神经网络中不同的学习模式和学习算法所需要的时间开销各不相同,但通常说来,神经网络的训练时间较长,并远远大于单个数据的处理时间。

  工作阶段:训练好的网络即可用于实际工作,此时网络的连接权值和连接方式固定不变,工作过程表现为输入数据在状态空间的映射和变化过程,神经网络最终的稳定状态即是工作输出。与学习阶段的时间开销相比,工作阶段的速度相对较快。因为神经元的状态在工作阶段经常发生变化,一次阶段神经元的状态被称做短期记忆。

  在数据挖掘分类模型中,主要运用的方法是BP神经网络,即多层前馈神经网络。

  回归模型

  在上市公司财务风险分析中,目标变量是一个布尔变量(0和1),因此需要采用广义的回归模型如Logistic Regression和Probit Regression。

  Logistic Regression提供了4种变量选择方式在逻辑回归中,用来做变量选择的有四种方法:

  1)前进式选择:开始在模型中没有变量,然后计算变量对模型的贡献,一旦超过了对目标的最小递增贡献,这个变量就会被加入到模型中。

  2)向后消除:它与前进式选择正好相反,首先,所有的变量都被选入模型,然后看它们的最小贡献,如果没有达到,就被一个个地消除。

  3)逐步法:类似与前进式选择,在每一步中,它同时动态地添加和删除变量直到达到最佳的组合。

  4)评分法:用分枝定界法来寻找一个特定的卡方值最高的变量组。

  挖掘上市公司财务风险

  在上市公司财务风险分析中,通过三种数据挖掘算法获得了预测财务风险的主要变量,这些不同的财务指标变量反映着企业不同的财务侧面,如盈利能力、偿债能力、周转能力、现金能力等方面。

  这里以决策树为例说明如何获得数据挖掘结果,建立决策树的目的是试图发现那些可以用来分开“好”和“坏”的变量。在图2中,全部样本有360家,其中180家是训练集,180家验证集,在训练集和验证集中,都有7.1%是“坏”公司。

  决策树根据尽可能把“好”和“坏”区分开的原则把一个节点分割成两个子节点。

  从以上的例子,可以发现在训练集中的180个公司被分成2组,左边一组满足“每股收益(元)_R3<0.1183”的条件,有100%的“坏”,但是右边组只有5%的“坏”。换句话说,每股收益(元)_R3能够很好地区分“好”和“坏”。

  除了能够从树状图中读到一些关键数值,还能通过比较训练集和验证集中“坏”比率的一致性来检验决策树的分裂准则的稳定性。一棵好的决策树应该在训练集和验证集都有一致的比率,如果不是,我们称为“过拟和”,也就意味着,分裂的准则只适用于训练数据集,如果运用到其他数据集中,则很有可能失败。 

 

  

相关文章
  • 本文关键字:
  • 财务 (12)
  • 股市 (3)
  • 模型 (1)
  • 网友关注
    热门产品
    编辑推荐
    推荐专题
    更多
    论坛热贴
    更多
    博客精选
    更多
    视频推荐
    更多
      TMG

      Copyright (C) 1999-2008 Chinabyte.com, All Rights Reserved 版权所有 天极网络

      渝ICP证B2-20030003号 商务联系、网站内容、合作建议:010-82657868

      版权声明 在线提交意见反馈 Powered by 天极内容管理平台CMS4i

      经营性网站备案信息 网警备案 中国网站排名