大数据背景下的寿险产品定价与

摘 要:本文主要探讨大数据对保险业的影响,并以实例说明在大数据背景下传统寿险产品定价的改进以及新型保险产品的开发情况.首先基于实际数据对于保险业大数据现状进行了统计分析,给出了保险业数据量现状以及数据使用效率的统计结果;其次以实际大数据量为基础,对传统的寿险产品定价进行了改进,获得了更优的市场比较优势;最后,以大数据量为基础,打破传统寿险产品的思维定式,开发出新型的保险产品并对产品风险进行了精确测定.

关 键 词 :大数据;数据挖掘;精算定价;保险创新

中图分类号:F840 文献标识码:B 文章编号:1674-2265(2013)12-0069-05

一、前言

大数据又称为巨量数据、巨量信息、海量数据,指的是所涉及的信息量非常巨大,以至于传统的软件和技术无法进行有效的信息获取.大数据技术就是在这种海量数据下有效的数据分析技术,即能够在各种各样类型的数据中,快速获取有价值信息的能力.

作为金融行业的分支,保险因为自身的特点而与大数据关系更加密切,它天然就具有大数据的特征,这是因为:

第一,众所周知,保险业是经营风险的行业.它的产品本质就要求对标的物风险进行精确测定.而如何测定这些风险,一方面需要金融模型和数理技术,另外一方面就需要数据信息,两者缺一不可.海量数据为保险公司测定风险提供了“天然”的机会.对于保险公司来说,大数据技术实际上就是如何利用公司的海量数据来界定风险.

第二,保险公司的利润来源于收取的保费和未来的赔付支出的差额,这其中的赔付支出即为保险公司的风险,而该风险与标的物的未来风险密不可分.保险公司实际上是对这些风险发生的概率进行预测,这和大数据的本质不谋而合——大数据的一个关键核心就是预测.

第三,保险经营的每个过程都和大数据密不可分.保险公司经营过程中涉及产品定价、核保核赔、产品销售、投资、风险管控等,这其中每一步都在不断利用数据,同时也在不断产生数据.

实际上,从信息量来看保险业,大数据时代早已经提前到来.随着信息技术的发展,保险公司每时每刻都要积累大量的数据信息,整个数据量的级别呈现爆炸式增长.但同时要看到,保险行业的大数据技术还刚刚起步,保险公司还没有充分且主动地利用大数据提供的优势.

二、保险业大数据现状

在大数据现状调查中,本文集中统计了保险业的情况.统计所涉及的公司包括117家保险公司,占大陆全部保险公司的97%以上,基本上可以代表保险业的整体情况.在117家保险公司中,有58家人身险公司和59家财产险公司.人身险公司当中外资公司23家、中资公司35家;财产险公司当中中资公司38家、外资公司21家.

统计的结果是数据量.在保险公司里,数据量主要包括这样几部分:

第一是保单数据及保单维持数据.这部分数据基本上都在业务系统中.

第二是核赔理赔数据.这部分数据大部分也在业务系统中,同时部门内部也有对应的数据库.

第三是投资理财数据.因为寿险经营时间长,保费投资是寿险经营的重要方面,所以这部分数据在寿险公司中体现最为明显,导致大量的金融市场数据集中在投资部门.这部分数据通常和业务系统是分离的.

第四是定价数据.这部分数据是精算部门用来定价和利润测试,以及用来向保监会报送各类报表运算的时候需要的,有相当一部分来自于业务系统.

第五是风险管理数据.这部分数据相当零散,且涉及以上各类数据,同时还包括公司的财务乃至宏观管理数据.本文在统计中也把行业公共数据以及监管数据纳入其中统计.

对每家公司进行全部数据的估算后加和,结果扣除公共数据(金融市场数据以及公共行业数据和监管数据)就得到中国保险业整体的数据量情况.图1给出了最后的统计结果.

从图1可以看出,中国保险业的数据量呈井喷式增长,这也说明了大数据是目前保险业必须面对的考验.

同时对个体公司进行详细分析,来考察一家普通保险公司在生产经营过程中需要面对的数据量.图2给出了相应的结果.

[图2:普通保险公司所面临的数据量]

可以看出,对于普通保险公司来说,其面临的数据量和整个行业的数据量没有本质的区别,这也充分说明保险业的深化改革已经有一定成效,保险公司的充分竞争已经得到很好的体现.在这样海量数据信息的背景下,保险公司在定价、营销、经营以及风险管理方面都必须引入大数据技术来获得相对于行业的比较优势.

那么实际情况如何呢?本文对保险业2008—2012年的数据使用效率进行了统计和分析.这是一个很复杂的问题,在此本文主要给出在产品定价方面的结果.大数据的特点是容量大(Volume)、速度快(Velocity)和资料多样性(Variety).本文的评价也是从这个角度来进行的.需要说明的是,在统计过程中,限于公司保密等原因,结果仅仅包含25家寿险公司和23家财产险公司.但结果总体上也反映了在定价方面保险业大数据技术的发展程度.

图3真实地反映了目前保险公司在定价方面的数据效率,近5年基本上没有特别大的变化,并没有充分挖掘大数据的潜力,在大数据技术上还有很长的路要走.正是基于这种现状,本文尝试从大数据背景出发,以寿险定价为例来说明大数据技术的初步应用.

三、寿险产品精算定价的“再精算”

通常,寿险产品定价是基于寿险精算模型进行纯保费(精算现值)的计算,然后使用“资产份额”和“宏观定价法”来确定实际保费.这个过程中,涉及的数据量实际上仅仅包括传统的生命表(保监会规定)以及部分抽样数据,这部分数据仅仅占可利用数据的5%左右.

在保险公司持续经营的情况下,新开发的一种保险产品,它在传统数据依赖上可能只需要一些精算部门的经验数据,以及传统的已经做好的模型,只需要修改一些基本假设和预订费率、预订利率以及预订死亡率即可. 在大数据背景下,与此保险产品有关的数据范围扩展到了整个业务部门乃至核保核赔部门,这些部门的数据经过多年的积累能够进行有效连接,形成一个庞大的后台数据记录.以某一家普通保险公司为例,该数据连接后形成了一个900M的数据记录池,这些客户的记录无疑能够对传统定价有很大的帮助,能够将精算定价的结果进行“再精算”过程.

寿险产品中最重要的就是死亡率.在传统定价方法中,使用的是2000—2003年生命表.该生命表已经使用多年,反映了当时的死亡状况.对于一款推向市场的寿险产品,它所面临的人群实际上是未来的客户,他们的死亡率状况与2000—2003年生命表已经有很大差异.

利用大数据平台,可以构造庞大的分年龄和分时间死亡率表,在处理之后得到表1,截取的是2003—2009年,国家统计数据实际是从1983年开始的.

四、寿险产品的细化分类与创新

进入21世纪以来,金融业的创新层出不穷,保险业也在面临着创新的压力,大数据为保险业的创新提供了数据基础和机会.保险本质上是“大数定律”,对于任何一个群体来说,只要投保的数量足够多,就可以应用“大数定律”.保险产品的定价本质上就是对“风险”的度量,只要风险能够度量,就能够给出一个合适的,以此出售产品就能够保证收支平衡.这正是保险产品运作的方式.

但对于风险的度量和精确测算并不是一件容易的事情.所以传统的保险产品都人为限定为“标准体”;其他的“非标准体”都被保险例外条款而排除在外.这个过程实际上浪费了大量的数据和信息.

大数据修正了大数定律,拓展了风险覆盖的程度,保险公司可以基于数据优势,进行群体的细化处理,针对不同群体开发不同的保险产品,从而启动新的赢利增长点,开发出新的业务模式.

本文以寿险为例,以上述900M数据加上该公司健康险5年的数据以及合作医院的跟踪数据为基础(总数据基础大约在1.5G左右),开发针对重疾患者的定期寿险产品.对于该产品定价来说,很重要的因素有两个:第一个就是首年发病率,它实际上衡量了新产品与传统产品的“偏差”——意味着健康体从健康状态转移到了疾病状态,进入了“意向购买人群”;第二个就是病死率,即疾病人群的死亡率,作用与传统寿险的死亡率相同.具体测算步骤如下:


第一步,从该公司的承保理赔库中筛选出重大疾病保险的承保理赔记录,筛选出所需字段,添加需要计算的字段,如年龄段、疾病种类、理赔数、暴露数、保单周年日等.

第二步,1999—2011年13年中具体某一年的测算方法为:假设保单周年日与被保险人生日是重合的,以保单周年日为分界点,将该年度一分为二,分别记有保单年度1、年龄段1、理赔数1、暴露数1和保单年度2、年龄段2、理赔数2、暴露数2.对保单记录做出调整(如失效日期调整、满期日调整、多次索赔合并调整等)后,按照矩估计精算法为每条保单记录分别计算出其在该年度前后两部分的理赔数1、暴露数1和理赔数2、暴露数2.按照年龄段对上述数据进行分类汇总,即可得到该年度内不同年龄段的理赔数和暴露数,二者相比即为该年龄段在该年内的重疾发病率.

第三步,13年中的每一年均重复上述处理过程,共计算13次.结果可得到13年中每一年不同年龄段的理赔数、暴露数和重疾发病率.将13年的理赔数、暴露数再次按照年龄段分类汇总,即可得到不同年龄段总的理赔数和暴露数,二者相比即得到该年龄段的总重疾发病率.

第四步,上述步骤所得结果是所有重疾的一个疾病总发病率情况,也可分疾病种类测算出每一种具体疾病不同年龄段的发病率情况,测算方法与上述步骤相同.

以癌症患者与糖尿病患者为例,发病率和病死率测算结果分别如表4和表5所示.

实际上,中国糖尿病患者有9000多万,其他重疾且可保群体数量在3亿左右,相当于美国人口数量.这部分群体因为本身处于高风险状态,所以对保险的需求比正常人更加强烈.但在传统保险框架内,他们却因为“非标准体”的原因而被拒保,这是一个巨大的矛盾.基于大数据,保险公司可以对该群体进行细分,并精确测定其风险水平,推出适合的保险产品.

五、结论

综上所述,有以下几点结论:

第一,保险本身是经营风险的行业,测算风险、把握风险和利用风险是保险公司竞争力的核心体现,所有这些都需要获得信息,获得大数据背后的有用信息.通过对中国保险业的大数据现状进行调查和统计,本文给出了目前保险业的大数据概况.统计数据表明,中国保险业利用大数据的效率很低,仅维持在7%左右,远远没有充分利用大数据“数量巨大、速度快捷、形式多样”的特性.

第二,在保险的技术核心层面,大数据为寿险定价提供了“再精算”的机会,能够让保险产品更真实地反映风险状况、获得定价优势、在市场中抢占先机、增强公司的风险管控能力.

第三,在保险公司的经营层面,大数据为“寿险产品创新”提供了很多机会.保险公司可以充分利用数据优势来开发新产品、新技术,以拓展市场.

总而言之,大数据为保险公司提供了“机遇”.保险公司必须重视发展大数据技术,以期在大数据背景下的金融市场中获得竞争优势.

(责任编辑 孙 军;校对 XQ,SJ)

类似论文

大数据背景下主旋律电视剧的传播

【摘 要】大数据的兴起为很多行业带来了深刻的变革,电视行业也抓住机遇,率先借力大数据,实现发展,而作为建构主流价值观的主旋。
更新日期:2024-12-12 浏览量:155681 点赞量:33488

大数据背景下电子商务与快递业联动策略

摘 要:分析大数据背景下我国电子商务与快递业的现状,研究影响电子商务与快递业联动发展的限制性因素,包括信息共享能力。
更新日期:2024-3-1 浏览量:11644 点赞量:4574

大数据背景下银行业会计优化路径

在经济全球化浪潮下,我国金融业,特别是银行业的发展受到外部和内部条件的严重影响,银行业的发展面临着越来越剧烈的市。
更新日期:2024-5-15 浏览量:69927 点赞量:16052

大数据背景下的金融行业现状

大数据作为近一年互联网研究领域兴起的新兴课题,在越来越多的行业和产业中扮演着重要角色 首先介绍我国大数据和金融领域现状,并提出基于。
更新日期:2024-1-3 浏览量:7471 点赞量:3146

大数据背景下的寿险产品定价与

摘 要:本文基于实际数据对于保险业大数据现状进行了统计分析,给出了保险业数据量现状以及数据使用效率。
更新日期:2024-6-3 浏览量:14091 点赞量:4629