北京物流信息联盟

创新管控促数据质量三性同增——企业征信系统数据质量工作情况及改进思路的报告

2021-04-25 11:14:31


来源:《中国征信》2017年第5期。


作者:征信中心企业业务部。


全国集中统一的企业征信系统始建于2004年,2007年以前工作重心是建设系统,采集数据、联网推广、扩大覆盖面,这期间中心举办了多次数据接口规范培训,与商业银行共同研究接口开发和测试过程中出现的问题,努力确保数据提取的质量。2007-2009年中心工作重心是提高数据质量,集中解决全国性银行的数据质量问题,采取赴商业银行现场核查等手段,全面提高系统数据质量。2010年以来中心工作重心逐步向改进产品和服务、深化应用转变,但数据质量工作仍未放松,一方面指导分中心抓好地方性金融机构数据质量的治理和全面提升,另一方面探索建立保障数据质量的长效机制。经过多年的努力,形成了一套较为系统的企业征信数据质量治理体系,同时,随着环境变化和技术发展,各项治理工作也需要不断改进完善,以保持数据质量高位稳定。


数据质量现状


征信系统的实质是一个信息共享系统,能够准确、及时、全面的反映信息主体的信用状况,是对征信系统最基本的要求。完整性方面,首先从系统建设角度保证接入机构的覆盖全面性,然后保证各接入机构的各类信息都能报送入库;及时性指一笔信贷业务从发生到报送至企业征信系统的时间间隔,是否满足T+1的报送要求;准确性指企业征信系统中的数据是否与数据源内容一致。


完整性


首先,从机构覆盖度来看,第一类由银监会批复成立的从事信贷业务的银行业金融机构和非银行业金融机构,覆盖程度较高。截至2017年9月底,应纳入征信系统接入范围的存量机构共4534家,已接入3522家。尚未接入的机构主要是村镇银行、金融租赁公司、财务公司等类型机构,其中村镇银行占比达85%。目前,有506家机构正在开展接入准备工作。


、各地金融办(局)、经信委、工信委等批复成立的融资租赁公司、小额贷款公司、融资担保公司和保理公司,接入覆盖度较低。经不完全统计,第二类机构共有2.4万家,已接入企业征信系统的1759家,比例不足十分之一。其中大部分是通过各地省级虚拟平台和互联网平台建设推广初期接入的小贷公司和融资担保公司。目前,符合接入条件且有接入意愿的机构仍在陆续申请接入。2017年前三个季度,共有15家融资租赁公司、8家两类机构完成接入实施;有17家融资租赁公司、10家两类机构提交申请,正在开展接入准备工作。


第三类由证监会、,这类机构经营稳定、技术实力较强,但对征信的需求并不迫切。目前,已有29家证券公司、7家保险公司接入企业征信系统,其余机构也在按序推进。


其次,从已接入机构业务数据报送的完整性来看,对于通过金融专网直接接入的机构,中心进行数据质量管控的主要手段是数据质量考评。以2017年第一季度考评结果为例,参与考评机构为686家,主要为上述第一类机构。涵盖业务数据占全库数据的93.2%。从考评结果中通过两端数据核对反映的数据完整性来看,占库中数据比例49.6%的21家全国行,99.71%的借款企业和99.29%的信贷业务均已报送至企业征信系统;占库中数据比例40.3%的350家地方性接口行,99.74%的借款企业和99.31%的信贷业务均已报送至企业征信系统;占库中数据比例3.3%的315家地方性非接口行,99.30%的信贷业务余额已报送至企业征信系统。另有184家机构,约2.9%的业务数据因机构新接入系统、接口程序升级切换等原因尚未纳入到考评结果中。通过各地虚拟平台和互联网平台接入的机构有2090家,报送的信贷信息约占全库数据的3.9%,中心目前对其进行数据质量管控的主要手段是监测数据报送情况和异常数据扫描。


其中,通过互联网平台手工录入数据的1486家机构中,仅51.55%的机构报送过数据,13.31%的机构在正常更新数据,数据报送完整性普遍较差。


此外,企业客户的财务报表信息报送比例较低。自2014年底贷款卡行政许可取消后,企业客户的财务报表信息主要依靠接入机构报送,报送率较低。根据2016年12月的摸底情况,所有贷款余额在500万元以上的企业中,财务报表报送率仅25.92%。


及时性


从历次考评结果中反映的及时性指标来看,参加考评的多数机构企业征信数据报送的平均延迟度始终保持在T+2以内,仅信托公司由于其业务的特殊性保持在T+7以内。另外,我们使用同一评价标准,对不同接入方式机构的及时性分数进行对比。结果显示全国行的及时性明显高于地方行,接口行的及时性明显高于非接口行,内网直接接入机构的及时性明显高于通过省级平台和互联网平台接入的机构。


从总量上来看,满足T+2的数据量占比高达96%,因此及时性问题对数据质量的总体影响可控。


准确性


首先,从2017年第一季度考评结果看,准确性考评结果中,全国行两端数据一致率达99.28%;地方性金融机构两端数据一致率达99.36%。考评中发现的不一致数据均已及时反馈各机构核查纠改。


其次,我们通过每月定期的异常数据扫描及时发现数据准确性问题,目前主要是逾期可疑数据和担保缺失数据两类。经统计分析,存量逾期可疑数据约7万笔,存量担保缺失数据约4.6万笔,总计约占未结清业务的0.35%。对于每月扫描发现的异常数据,我们及时推送机构进行核实纠改,金融机构对错误数据的修改较为及时,因此对数据质量整体的影响在可控范围之内。


数据质量问题分析


从现有数据质量考评结果及其他日常管理工作中反映出的数据质量问题来看,当前完整性问题较为显著,准确性和及时性问题相对可控。影响完整性的因素主要有三个方面,一是接入机构的覆盖范围尚不全面,银监会批复成立的第一类机构中还有大量村镇银行尚未接入,第二类机构和第三类机构覆盖面仍较小;二是接入机构接口程序开发或升级过程中因业务理解或技术障碍会导致数据漏报,或因技术原因提取的数据不符合要求,不能通过校验,这两种情况在许多机构仍还存在,后续也难以彻底避免,是需要通过考评、核对、监测等手段不断发现并及时解决的;三是机构出于维护客户利益的考虑,利用流程不规范的漏洞,,该情况多数发生在使用手工方式录入数据的小微机构。


数据质量问题的另一个特点是,不同类型、不同报数方式的机构间数据质量水平不均衡。近几年来,企业征信系统机构接入方式和机构类型呈现多样化。报数程序分接口、非接口,接入渠道有专网接入、互联网接入,组织方式有直接接入、省级平台接入、发起行统一接入等不同类型。机构类型方面在传统的银行类机构之外,还增加了融资担保、融资租赁、证券、保险等其他类型机构,数据结构与传统银行类机构存在差异。现有数据质量考评指标及方法对其并不适用,数据质量水平处于未知状态,急需建立覆盖各类对象的多层次的管理体系,实现对全部接入机构的有效管理。


当前工作机制的主要问题


尽管过去的数据质量治理取得了很大成绩,但随着实践经验的不断总结和外部环境的变化,我们也看到数据质量工作机制面临的问题和存在的局限,制约了数据质量工作深入有效地开展。


管控手段有待完善


现有的数据质量管控方法和制度存在很大程度的局限性,不能满足新形势的需要。具体表现在三个方面:


首先,机构考评范围覆盖不全面。主要表现在现有考评方案对新接入的融资担保公司、资产管理公司、保险公司、证券公司均不适用,考评范围尚未覆盖到上述机构;对于省级平台和互联网平台下手工录入数据的机构也缺乏可行的考评流程;另外对于基本信息和财务报表信息的考评,也因技术问题而未能按期实施。


其次,量化考评指标固定单一,针对性不强,更多侧重对单家接入机构的考核,缺乏对数据库整体进行评价的方法。目前,量化考评通过9个指标刻画出单家机构数据的完整性、及时性、准确性,再按照参评各家机构的业务量作为权重,计算出企业征信系统的整体数据质量水平。问题之一是对不同类型机构使用相同的考评方法和达标标准,未考虑如信托公司普遍低于银行的特殊性,对该类机构而言缺乏提升空间。问题之二是过多依赖与银行端数据的核对工作,缺少从数据库自身角度评价数据质量水平的方法体系。另外,地方性机构考评工作中,我们依据所辖地区机构数据质量水平对各分中心进行评比的方式,会导致数据质量较差机构不主动参评。


最后,对机构的主动支持不足,事前沟通不充分,将问题积累到事后难以解决。对机构的主动支持不足,尤其是在事前把关方面,对机构的接入指导较为薄弱。接口机构及其开发商对征信接口规范的理解容易存在偏差,接口开发质量不高,测试周期冗长;非接口机构使用的MBT报数系统基本不做配套升级,软件问题多,错误数据解决困难。


系统功能待加强


一代系统几乎没有提供数据报送质量监测与预警、数据核对、数据分析等配套功能。数据入库前、入库过程中和入库后的数据质量管理工作自动化程度过低,问题发现环节滞后。数据质量工作人工环节多,工作效果取决于工作人员的责任心和实践经验,效率和准确性没有保障。缺乏对数据的深度分析,无法及时发现数据本身反映出的客观规律和异常情况。


另外,应高度重视征信系统软件问题对数据质量的影响。实践证明数据采集程序升级会对数据质量水平产生重大影响:由银登系统升级为企业征信系统时,因软件问题和机构理解问题导致业务余额虚增、担保虚增问题,全部解决历时2年;企业采集机制一期改进、企业基本信息采集等升级过程也都引发了大量数据质量问题,影响数据质量的稳定。


保障机制待完善


首先,中心对金融机构的数据质量工作要求缺少有力的约束手段。中心主要通过定期的通报发文提高金融机构的重视程度,在督促指导之外,对纠改不力的行为也没有有效的约束手段。另一方面,,《征信管理条例》要求从事信贷业务的机构应当按照规定向征信系统报送信贷信息,但是对未能达成企业征信及时、准确、完整的数据质量要求的情况,并无明确的处罚措施。


其次,数据质量工作队伍有待补充。现有条件下,中心的数据质量治理工作以中心为主导,离不开分中心、下属公司的协作支持,对分中心、下属公司如何定位,如何激发分中心的工作热情、合理地利用下属公司的专业优势,是巩固工作成果、提升数据质量管理水平不可或缺的重要组成部分。


下一步改进思路


针对当前数据质量工作存在的突出问题,结合一代系统向二代系统升级的重要契机,我们拟定了下阶段数据质量工作的改进思路,以进一步完善企业征信数据质量治理框架。


优化数据质量各项管控手段,加强管控力度


一是与时俱进,扩大数据质量考核范围,改进考核方法。对信贷信息的考核上,首先,进一步扩大考核范围,逐步将不同接入类型和不同接入方式的机构全面纳入考核;其次,专项治理应参评未参评问题;再次,研究丰富和改进量化考评指标体系,完善现有数据质量考评方案,在未来一段时间一、二代系统并行、机构接口切换的过渡期和二代系统正式上线后,做好考评的应对方案,同时研究不依赖核对的数据质量独立评价体系;时机成熟时,推进企业基本信息和财务报表信息数据报送质量考核。


二是关口前移,中心对机构提供更有力的支持,提高接口开发质量。接口开发是事前管控的核心,接口开发质量奠定了数据质量基础,中心应加大对机构接口开发的指导,加大接口规范培训力度,充分利用中间机构的管理优势,从机制上帮助机构提高数据报送质量。


支持二代系统功能建设,提高数据质量管理专业化水平


基于统一的数据质量管理平台,实现日常报数监测、预警、数据提取、数据核对、异常数据核查等功能,实现数据质量管理自动化、流程化处理;开发利用有效的数据质量管理工具,深入开展数据质量分析;同时,为中心、分中心和接入机构各方在线沟通、核查和解决数据质量问题提供途径,提高工作效率;提供专用的数据测试环境,减少因系统升级带来的系统切换风险。


另外,配合做好二代系统业务测试和试运行工作,在数据采集方面投入足够的力量,对一二代系统采集程序的差异进行充分验证,将对数据质量的影响降到最低。


完善对接入机构的约束机制,加大人员和技术投入


完善对金融机构的约束机制,研究采取在双方协议中约定数据质量达标要求和违约责任、实施通报、停查询、减少查询费折扣等手段,约束金融机构保障数据质量水平。


保留现场核查作为必要手段。一方面,重点关注二代系统上线试运行报数情况,针对存在问题较多的机构开展现场核查,对接口程序和业务数据进行全面梳理并提出整改意见,以进一步提高机构


对征信工作的重视程度,规范征信报数工作要求。另一方面,,发现一起查处一起,如条件允许,也可借助征信管理局综合执法检查的契机,完成现场核查工作目标。


进一步挖掘中心内部潜力,加强业务研究和制度建设。加快队伍建设,建立有效的工作效果评价机制和激励约束机制,更多地发挥分中心的管理优势以及下属公司的专业和人才优势,共同协作促进数据质量管理。


版权声明:中国征信杂志(微信号:zgzxzz)所有注明来源于《中国征信》杂志的文章,请媒体和微信公众号转载时注明出处,否则将追究法律责任。欢迎转发至朋友圈。



友情链接

Copyright © 2023 All Rights Reserved 版权所有 北京物流信息联盟