查字典论文网 >> 数据挖掘技术在财产保险行业非现场内部审计中的应用

数据挖掘技术在财产保险行业非现场内部审计中的应用

小编:

数据挖掘技术在财产保险行业非现场内部审计中的应用

21世纪以来,我国财产保险行业得到了较快发展。国内财产保险公司早已引入了信息系统,建立起了涵盖承保、理赔、财务、销售乃至经营管理等方面的数据库,对企业的交易活动、经营状况进行记录。数据库和数据库管理系统的广泛运用,使得内部审计人员能够在激增的数据背后,按照既有的审计经验,查找出保险公司在经营环节上存在的违规行为,有效地对业务或财务行为的真实性、合法性和效益性方面进行监督,从而促进公司业务的健康发展。虽然激增的数据背后隐藏的许多重要信息给人们识别财务报告舞弊提供了更大范围的数据支持,但同时也衍生出一些新的问题,致使传统的以风险点为出发点的审计手段不能适应现代审计工作的要求。为提高审计质量,降低审计风险,迫切需要引入现代化审计方式和手段,以实现审计监督从单一的事后审计转变为事后审计与事中审计相结合,从单一的静态审计转变为静态审计与动态审计相结合,从单一的现场审计转变为现场审计与远程审计相结合。目前,各大财产保险公司相继进行了业务系统总集中,将业务、财务、理赔、影像等相关数据统一起来,这为非现场审计提供了必要的技术支撑。数据挖掘技术是处理纷繁复杂、日益庞大对象数据的一种新型信息技术。它采取排除人为因素而通过自动的方式来发现数据中存在的新的、隐藏的或不可预见的规律或事实,是在对数据集全面而深刻认识的基础上,对数据内在和本质的高度抽象与概括,所以把数据挖掘技术引入到审计工作中是非常必要的。

一、财产保险公司内部审计人员面临的问题

业务的迅猛发展,为保险公司积累了大量的经营管理数据,这同时也给内部审计人员带来了极大挑战,具体表现为:一是基础数据量超 大,审计人员在数以千万计的数据库记录中陷入茫然,在浩瀚的经营数据中很难找出对内部审计人员有价值的信息,犹如大海捞针;二是保险公司的业务流程、管理规定和操作实务不断更新,各项管控规定不断出台,新的违规问题变得越发隐蔽,审计人员对如此快速的变革往往不能与时俱进,既有的审计经验往往显得力不从心。KPMG(1998)调查发现,超过1/3的舞弊事件是在偶然的情况下被发现的,只有4%的舞弊事件是由独立审计人员发现的;三是简单的数据库查询语句,无法从庞大复杂的数据库中进行深层次剖析,不能发掘更多的审计线索,所得出的审计结论缺乏深度和广度,为规避自身审计风险埋下隐患;四是数据处理技术为违规者提供了更加隐蔽的违规手段,舞弊者可以通过数据修改的方式伪造数据,以假乱真,审计人员如何识别出被篡改的数据是个难题;五是对同一对象审计,由于审计方法、审计角度的不同,不同审计人员可能会得出完全不同的审计结论,问题定型不一,审计知识的“不对称性”无法保障审计质量;六是由于数据量的激增,垃圾数据、异常数据时有发生,如何将这些数据剔除,不干扰审计人员的审计思路,科学合理地安排审计工作,将精力投入到真正的审计问题上去,值得思考。

二、审计领域对数据挖掘技术的探讨

简单地说,数据挖掘指的是从大量的、不完全的、有噪声的、模糊的、随机的应用数据中提取出隐藏的、不为人知的却潜在有用的信息和知识的过程,是一个从数据中汲取潜在有用的、先前未知的和最终可理解的知识的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等诸多方法来实现上述目标。数据挖掘技术的应用非常广泛,我国学者也做了一些将数据挖掘技术应用到审计领域的研究工作。

易仁萍、王昊等(2003)探讨了审计框架下的数据挖掘技术的应用,提出了利用数据挖掘技术对原始审计数据进行初步的数据清洗并进行挖掘,形成可疑数据,为审计活动提供必要支撑。胡荣和陈月昆(2004)提出了关联分析和聚类分析这两种常用数据挖掘技术在审计中的具体实践。陈丹萍(2009)在《数据挖掘技术在现代审计中的运用研究》中提出数据挖掘审计的基本路径包括数据的采集、预处理、发现规律、发现异常和提出处理建议等环节;数据挖掘审计主要通过离群点挖掘、孤立点检测等七种方法获取有效证据;数据挖掘技术在审计中的应用步骤包括评估被审计单位、内控制度的符合性测试和实质性测试审计三个方面。

三、数据挖掘技术在财产保险内审领域的应用

数据挖掘技术可实现的目的很多,在此仅列举目前对财产保险公司内部审计工作最有帮助的几个方面,主要有:

(一)统计分析。首先根据已有的审计经验,确定出固定的审计模型,然后将该模型运用到被审计单位的对象数据库上,对审计区间内的业务数据进行分类,借以实现对保险经营管理行为的分类和预测。

(二)聚类分析。它是把被审计单位的业务数据按照相似性归成若干类别,使得同一类别的个体之间的差异尽可能地小,而不同类别的个体间的差异尽可能地大,从而找出偏离主类别的业务数据。

(三)关联分析。通过利用关联规则,从被审计单位数据库的记录中抽取频繁出现的模式,找出隐藏在数据间的潜在关系,抽取出事项A和事项B出现的频率和相

关性,从而通过对A对象的分析达到对B对象分析的目的。

具体实施流程如下:

1、需求提出阶段。根据特定的审计目标和审计内容要求,将审计问题进行描述和表达,并将审计问题转化为数据挖掘问题,然后转化成数据库语言,编写提数语句。

2、数据清洗阶段。明确数据来源,熟悉数据结构,从被审计单位数据库中选择适用于数据挖掘的数据源,在充分了解数据质量的情况下,运用数据库中表与表之间的勾稽关系,剔除垃圾数据和异常数据,对源数据进行转换和清理,做到基础数据的可靠性和完整性。

3、数据挖掘阶段。针对所要发现审计问题的类别,确定采用的挖掘操作类型,如统计分析类型、聚类分析类型、关联分析类型等,设计或选择出有效的数据挖掘算法,形成特定的数学分析模型并加以实现。数据挖掘阶段是核心阶段,可能一种类型不适合,需要选取另一种类型,也可能同时需要几个不同类型的数据模型进行分析,此时可能会出现反复现象。

4、评估阶段。根据已掌握的审计证据,对挖掘结果进行解释和评估,测试与评价所发现的审计结论,对审计结论进行一致性、效用性处理。由于模型的建立是一个迭代循环过程,因此可利用反馈机制,利用已有的模型不断地建模、分析,直到能够得出充分、正确的审计结论为止。

5、发布阶段。根据审计人员的审计目的,对所获得的审计结论进行组织,并以审计人员能够使用的方式呈现,从而使审计人员能在审计数据分析工作中运用所发现的审计结论。

上述各步骤不是一蹴而就的,各步骤均可能需要反复进行,这取决于每个阶段的结果和接下来将要实施的阶段或者一个阶段的具体任务。(图1)

四、实际审计工作中的具体案例

随着保险市场竞争的加剧,不规范业务行为时有发生。下面结合笔者工作实际,对数据挖掘在保险公司内部审计上的具体应用进行案例分析。

审计需求:查找出经营机构违规列支会议费、招待费问题。此问题如果按照常规手段,通过调阅财务凭证的方式,人工来发现问题,几乎很难实现。如果将此问题转化成数据挖掘问题,对一个地市级(或者省级)分公司下辖各分支机构的会议费、招待费财务数据进行分析,就可以快速地查出违规机构。具体步骤如下:

(一)需求提出阶段。本案例的需求为查出违规列支会议费、招待费问题。鉴于基层经营单位有可能同时在会议费、招待费两个科目之间来回列支费用,故此需求可以细化为3个小需求,既违规列支会议费需求、违规列支招待费需求、违规列支会议费和招待费需求。

(二)数据清洗阶段。首先剔除掉费用金额字段值为空、字段值超大或超小、收付日期过早或过远的垃圾数据、测试数据、异常数据,然后选择恰当的收付区间作为审计区间,选好基础数据。

(三)数据挖掘阶段。由于此问题要解决的是违规列支费用问题,也就是要提取出来属于超额列支的那部分费用,因此要掌握公司正常经营管理下的费用列支状况。然而,每个基层公司的经营管理状况并不相同,单纯从自身的角度去纵向比较,科学性难以保证。因此,要掌握同一市公司(或省公司)下的各个经营机构的实际状况,状况趋同的视为合理情形,偏离大多数的视为疑似对象。 (四)评估阶段。根据步骤(三)数据挖掘阶段取得的初步性结论,结合被审计单位业务经营实际状况做出进一步的判断。若初步判断审计结论合理,可与被审计单位进行确认。若被审计单位提供了合理的解释说明,则要进一步修改聚类分析模型,加入必要的参考因子,比如业务类型、市场环境等加权因子,重新迭代计算,再次得出审计结论。

(五)发布阶段。根据上述数据挖掘模型取得的成果,将此模型运用到所有辖区单位,绘制出辖区单位违规列支会议费、招待费的全景预警图,供日后审计使用。

热点推荐

上一篇:税务审计中应注意的几个问题

下一篇:如何对幼儿进行德育教育论文 幼儿园关于德育教育之类的论文