保险资讯

保险变革与数据变迁息息相关

更新时间:2017-08-25 23:42

  【摘要】今年是保险业发展最快的一年,而保险变革时代也已经来临。如今保险已经成为人们生活中必不可少的一部分,保险在这种情况下也越来越完善。如今大数据时代,人们对数据也有了全新的认识,对保险也有不同的理解。

  保险从“抽样”到“全量”
  传统统计学研究的一个重要基础是抽样调查,通过抽样调查得到一定的样本数据,并以此作为分析的基础。但抽样调查存在两大限制和缺陷。一是视角,做问卷调查,需要设计调查问卷,而问卷设计本身,是带有主观色彩的,即先设定哪些领域会存在哪些问题,并据此设计出相应的问卷问题,这实际上是由过去的知识体系决定的。
  然而,过去的知识体系并一定不代表着调查对象的客观和全貌,所以,抽样调查的样本本身就可能存在一定的局限性。二是样本量,在抽样调查过程中,样本量总是有限的。如果样本总量是有限的,从对象的角度看,其随机性和代表性都值得商榷。比如,街头的问卷调查,就受到一定的局限,一定是有些群体懒得搭理你,而有些群体就很喜欢跟你聊。这就意味着受调查的基本上是相对有闲的人,或比较热心公益的人,所以,调查结果至少没有代表那些拒绝的人。
  另外,在市场化环境下,抽样调查也受到人们质疑,特别是在委托调查公司做抽样调查时,它的报价主要依据是调查的样本量,不少调查公司从竞争和成本的角度出发,最终只能在实际样本上“做文章”。所以,从抽样调查的样本量看,也存在一定的限制条件。
  大数据时代带来的重要变化主要有两个:一是“数字社会主义”,另一是“数位人生”,即整个社会都被数字化了,每个人也被数字化了。全面数字化的信息和无处不在的感应终端,将彻底改变传统数据获取的可能性和效率。
  更重要的是信息的数据化是与生俱来,这种数字化趋势将会产生两个结果:一个是这种数据(信息)很客观,第二它是全量数字,这大大降低人为和主观的干预因素,为计量科学创造一个无限的想象空间和实现的可能性,也将彻底改变统计的存在和实现方式。最典型的应用将出现在人口普查领域,以前做一次人口普查非常不易,人力资源投入大,周期长,且成本高。
  但大数据时代,很多调查和统计分析方式将发生质的变化,都将彻底改变人口普查的方法,继而改变管理模式。再比如,我国每年大约有70亿人次门诊量,现在这些门诊信息均逐步地被数字化了,这意味着将彻底改变医疗诊断、流行病管理、药理学、健康管理等领域,也将彻底改变统计和精算的基础。可以预见,从抽样数据到全量数据,将引发统计、精算,乃至整个社会管理的巨大变化。

  保险从结构到非结构
  数据主要分为两类:一是结构数据,二是非结构数据,还有一种叫半结构数据。从处理的角度看,结构数据相对简单,目前对于结构数据处理的技术相对成熟。另一种是非结构数据,如音频、视频、图像等。长期以来,在整个社会的数据中结构数据的占比达到95%以上,非结构数据非常少。但近年来,特别是面向未来,非结构数据将呈现井喷式的发展,占比将大幅度并急剧提升。但是,带来的问题是未来需要我们更多地管理和处理非结构数据,既是一个挑战,更是一个商机。
  如在理赔过程中,未来图像比对技术将成为理赔的一项技术,在查勘时,可以通过拍照,甚至是做一个三维图像,与原厂配件的数据做一个比对,就知道受损的面积多大,大概修复费用是多少。同时,图像比对技术还会在更大的范围进行应用,如用声音波纹比对、瞳孔比对,耳朵比对等等,进行被保险人的身份识别等,在保险领域具有非常广泛的应用前景。这些均属于非结构数据的管理和处理能力范畴。所以,非结构数据的管理和处理能力将成为未来保险业创新主要动力,行业需要高度关注。

  保险从质量到数量、维度
  过去是一个数据有限时代,能够获取数据的数量是有限的,维度就更少。在数据有限时代,人们更多地关注数据质量问题,保险公司很重要的一项工作就是抓数据质量,而数据质量一直是挺纠结的问题,原因是数据质量问题是说的容易,做起来非常难。但面向未来,在数据化、物联网、感应终端大量应用的情况下,数据将呈现“指数级”增长的趋势,数据在量上会极大的丰富,从而出现一个现象,即数据的自验证能力。
  当数据量大到足够产生自验证能力时,就会降低对数据质量的要求。我们可以在日常生活中找到这样的例子,当描述一个对象“点”的数量足够大的时,尽管单个点不是那么清晰,但从大的轮廓和面上看,对象是清晰的。
  除了数据的“量”和“质”的关系外,还要看到一个问题,无处不在的感应终端能够使数据的维度极大地丰富,从而使得对于对象的描述更加多维并丰满。原来更多是从一个维度去看,从一个平面去看的问题。当数据的维度不断丰富的时候,就可以从N个维度去观察对象,不仅看到正面,还可以看到背面和侧面等,且还可以实时地观察。
  这使得很多在传统数据环境下,原本不可能的实现的“对象刻画”成为可能。数据的实时获取、数据维度的丰富。而且是实时丰富,将给数据利用和创新带来巨大的想象空间。但与此同时,也会带来数据的“超高维”问题,挑战传统统计学的基础。
  在数据从质量到数量,到维度的时代,保险将面临从原来利用大数法则做归因分析的思维模式,向未来利用多维定律进行关系分析的思维模式,从几何学的角度看,就是通过多点进行定位的方法。从风险分析的角度看,以往更多的是用一种纵向的思维去看风险,如一个人,是通过对他家族史的风险分析,据此来判断他的性格以及各种各样风险因素,但直观地看,这个方法是很不科学的。
  未来,不仅可以利用这个人的历史数据,而且,这种数据是多维和实时的,这种多维包括通过其环境数据,他周边人对他的描述,就能够更加客观和科学地对其风险状况进行分析。这就是从质量到数量,到维度,带来的数据变迁。

  保险从内部到外部
  传统保险业的经营,更多地关注内部数据,包括公司数据和行业数据。但这些数据在解释风险时,是非常有限的。就车险而言,利用承保和理赔中提取的数据非常有限,是难以支撑科学和精细的灾因分析。
  车险经营将从保额定价过渡到车型定价,对保险业而言,是一个很大的挑战。在保额定价时代,基本逻辑是车价相同的车,风险保费是相同的。不久前,保险行业协会发布了一个关于汽车“零整比”的研究报告,告诉了所有人,特别是汽车消费者,不同品牌车辆的零整比最高甚至达到了12.7倍,报告从基础层面支持了车型定价的必要性。但即使采用了车型定价,那么,不同人的风险情况一样吗?在解决了“从车因素”后,下一步要将“从人因素”和“从用因素”纳入定价。
  就“从人因素”而言,现在是相对简单和粗放的,仅考虑性别、职业、年龄等等。但如果这些因素均相同的人,他们的开车风险能一样吗?答案显然是否定的。一个人可能刚刚拿驾照一年,且性格暴躁,另一个人拿驾照十年了,性格稳重平和,他们两个人开车能一样吗?所以,我们有一个基本的判断,无论是在趋势判断,还是在风险预测和解释上,行业内部数据均是非常有限的,甚至是不足的。
  所以,需要更多地关注和利用外部数据。比如,现在使用的生命表,或者现在的健康保险定价技术,更多地是基于有限的赔付数据,许多还是N年前的历史数据,怎么能够解释风险。我国每年有大约70亿人次的门诊量,还有大量类似数量级的社会数据。如果能够获得这些数据,无疑将彻底地改变保险经营最根本、最基础的东西。所以,以前更多地依赖于内部数据,未来会更多地依赖于外部数据,而能否获取充足的外部数据,将成为保险经营管理的重要能力。

  保险从历史到实时
  以往,保险更多是利用历史数据,而且数据的使用、处理都有一个较长的周期。如生命表编制,通常要用很长的时间。这种时滞的存在,越来越挑战对于风险的判断。更重要的是,过去的数据是过去的环境成就的,未来的情况将由未来的环境决定,简单地用过去预测未来面临巨大挑战。当然,原来没办法,只能利用历史数据。
  但是,现在人们可以获取大量的实时数据,就给了我们无限的想象空间,如能否建立一个动态生命表平台。另外,实时数据也面临着验证和稳定性的问题,同时还面临着对于数据应用的取舍问题,这些都是未来数据应用中面临的新挑战。总而言之,我们将从更多地依赖于历史数据,走向更多地依赖实时数据,同时在依赖和使用实时数据的过程中,也面临着新的挑战。

  慧择提示:从以上内容您就可以知道,保险经过历史的变迁,已经变得越来越完善。如今买保险已经成为一种时尚,许多家庭都为家人买一份保障。数据变迁将引发保险变革,大数法则决定了保险业的“数据宿命”,保险是一个与数据休戚相关的行业。