您的当前位置:首页正文

银行领域数据预测的技术研究

2021-12-05 来源:年旅网
J/:发删 I0 Development and Testing l 一 l 银行领域数据预测的技术研究 中国农业银行股份有限公司软件开发中心 王柳赵锋谢之波 国家气候中心 何文平 目前,金融机构对市场趋势的 用,并取得了一定的成果,尤其是 预测大多关注政策分析,虽然对于 遗传算法建模的智能性尤为突出。 国家政策和宏观调控举措的解读, 在对证券市场走向的预测中起到了 一现实社会是一个复杂的、开放 的非线性系统,尽管我们不知道描 本文应用人工智能遗传算法进行 述这类系统的精确动力学模型,但 建模,将演化建模方法引入银行领 是却可以得到现实领域的一系列特 域,为银行数据预测提供了一个新 解,即多年来积累的历史数据。如 思路。 一定的作用,但是,预测一般缺 乏历史数据挖掘的支持。由于人为 果把这些观测资料视为描述该系统 影响的特殊性和历史经验的参考 性,历史数据往往在预测未来走势 中扮演着举足轻重的地位。在对部 、的动力学模型的一系列离散值,解 相关背景 与数值求解相反的问题,即可反演 出较为理想的非线性动力学模型。 基于这一思想,黄建平等人于1991 基于历史数据建立数学模型, 分领域历史数据进行分析后,人们 并对其未来的演变趋势进行预测是 确实发现其常见的规律,也取得了 一一个重要的研究课题,传统的使用 年提出了一种利用实际观测资料反 些成果,但这些预测结果始终未 较多的方法有AR、MA、ARMA等 演非线性动力模型的方法,并利用 enz模型进行了检验,得到了令 线性模型,以及基于上述模型发展 Lor的一些组合模型,如ARIMA模型、 人鼓舞的结果。但这种方法在建模 能达到可以投入业务使用的水平, 特别是银行金融数据,数量大,维 度多,历史时间长,不可能对每个 双线性模型、TAR模型等,但这 过程中仍然存在以下困难:需要描 述系统的动力学方程所有变量的观 维度、每个类别的数据进行人工处 些模型存在着一定的缺陷:模型的 理,分析出内在的规律。因此,迫 线性特征;模型结构的辨识和参数 测资料;需要尽可能消除噪声的影 响;观测资料的标准化和特征时间  切需要一种智能方法,对海量历史 估计在实际建模中存在巨大困难;数据进行处理。近年来,基于人工 模型不能很好地反映数据的实时特 的适当性;该反演方法还处于探索 智能的数据挖掘方法逐渐得到应 性,导致其预报期限短等。 阶段,实际观测资料远lzELorenz模 2012 4,中国金融电脑 5 1 川图 型序列要复杂,有许多问题尚待改 进和完善。 因此,亟须发展一种能从观测 20l1年交易金额和交易笔数。为 的建模问题为如下数学问题:求解 了研究的方便,本文从各个维度中 一个包含了三角函数、指数函数、 选择A组数据,即2011年l1-12月 对数函数、幂函数等初等函数组成 的复合函数f所表示的高阶非线性常 资料中挖掘其潜在的动力学特征的 贷记卡核心账务系统的每日交易笔 建模方法,使其能够对系统的一维 演变进行预测。目前,演化建模方 法已经在一维和多维时间序列的动 态建模中得到了广泛应用。演化建 模主要是采用遗传程序设计优化模 型结构,以遗传算法优化模型的参 数,通过对模型的预处理、模型的 简洁化和规范化、模型的预测等辅 助步骤相结合,以此来根据观测数 据建立常微分方程。 我国的金融系统涉及证券、银 行等领域,拥有一系列的金融衍生 产品,在诸如汇率、股价、利率、 存款量、贷款量、理财等历史数据 中不仅蕴含了金融要素过去演变的 大量信息,而且还蕴藏着其未来的 演变信息,它是一个自组织、自适 应的复杂非线性系统,具有典型的 白适应特征,其自身的特点决定了 应用演化建模方法的优越性。 二.研究方法 1.研究数据 本文的研究数据资料来自201 1 年贷记卡核心账务系统和开放式基 金代销系统的全年运维月报数据。 由于系统的各自特点,使得统计 的维度有所区别,贷记卡系统统计 20l 1年交易笔数,基金系统统计 52 FINANClAL C0MPUTER 0F CHINA 数;另有B组数据, ̄132011年2-11 月基金系统中的每月交易金额两组 数据作为演化建模个例,研究其在 银行领域数据预测的可行性。在建 模过程中,A组数据采用2011年l1 月2日-12月20 13的49天数据作为演 化建模的参考样本,模型的预测检 验时段为2011年12月13-31日19天 数据。B组数据采用2011年2~9月的 84"月数据作为演化建模的参考样 本,模型的预测检验时段为201 1年 l0、l1月2个月数据。建模运算过 程中,将以演化建模的参考样本作 为演化对象,计算出最佳的数学模 型,然后用该数学模型计算出预测 检验时段中的预测数据,比较预测 检验时段的数据和预测数据的拟合 程度。 2.一维时间序列建模的数学 原理 定义n维向量A=(a』,ae,…,a竹)的范 数为 IIAII 、? t虞 (1) 假设一维时间序列在过去m个 时刻的一系列观测值可以写为列向 量形式为 X(t)=(x(t—m+1),x(t—m+2),…, x(t))T (2) 系统的高阶非线性常微分方程 微分方程,即 X (n)(t)=f(t,X (t),X (1)(t),…, x术(n—1)(t)) (3) 使得适应值lIX 一XII最小,其中 Hx 一Xll=、j】 一f)一x(t一0l (4) 这里m为建模的样本数。求得 形如(3)式的l阶微分方程后,再 将所得到的微分方程向前做步预 测。由于人们通常关注的是金融要 素随时问演变情况(例如存款、贷 款、基金),即时问的一阶导数, 因此,在建模过程中仅仅考虑一阶 非线性常微分方程的情况。 3.建模方程的表示 决定数学模型的最关键部分 是方程的函数表达式,将上述方 程(3)简写为X=f(x,t),就要确定 X=f(x,t)的形式,由于它是由初等函 数组成,在演化建模过程中,有遗 传程序GP(Genetic Programming)依 据变量 搜索上述基本函数,随机 地形成若干数学模型结构个体,不 断变化出不同的方程;与此同时, 参数优化处理程序不断对大量的随 机方程进行估算,比较适应值,选 取最接近时间序列数据的方程,淘 汰差的模型结构个体,保留好的模 型结构个体,最终求得一个误差最 小的数学模型X=f(x,t),这个就是混 厶f I Development and Testing I 上升再下降的过程,这个趋势被拟 备很强的预测能力。 且还能够对其未来的演变趋势进 合方程很好地捕捉到;对于基金数 行准确的预测,具有很强的实用 据,在最后2月中有缓慢上升的态 本文探讨在银行领域中引入演 性,显示出演化建模算法的数据 势,方程4仅显示了一个持平的过 化建模的方法,基于时间序列的一 挖掘能力,在诸如银行存款、贷 程,而方程3较好地体现出了这个趋 次演化建模,捕捉和挖掘对历史演 款、中间业务收入预测方面有较 势。由此可见,利用演化建模方法 化趋势模拟较好的非线性动力学 好应用前景。圆 对时间序列中潜在动力学特征进行 方程。实践结果表明,一次演化建 挖掘,表现出该方法对银行领域数 模得到的预测方程不仅能够较好地 据的模拟和预测中具有普适性,具 模拟金融要素的历史演变情况,而 2012 4,中国金融电脑 55 

因篇幅问题不能全部显示,请点此查看更多更全内容