• 0731-88280828
  • ,88281234
  • 0731-82200112
  • ,84418789(傳真)
您當前所在的位置:首頁

從封閉到開放——征信困境之再思索

【字體: 】  【來源:個人征稿】  【編輯日期:2019-04-24】  【點擊次數:485 】

摘 要:信用時代,征信為基!征信體系建設作為社會信用體系建設的基礎性工程,對于消解買賣雙方信息不對稱、防范系統性金融風險具有重要作用。我國在推進征信體系建設進程中也出現了諸如信用信息采集標準不一、采集范圍狹窄、交換共享存在信息壁壘等問題。本文立足于個人征信業發展現狀,結合百行及信用城市最新實踐及其對困境的突破,并從中總結其經驗,以法學、社會學、數學等多學科視角,從數據的歸集、處理及共享三個角度提出解決方案,望以此推動征信業的良性發展,為進一步建設社會信用體系打下堅實基礎。

關鍵詞:擴大采集種類;標準統一;數據共享;數據處理

 

社會信用體系是社會主義市場經濟體制和社會治理體制的重要組成部分。黨中央、國務院高度重視社會信用體系建設,習近平總書記說:“人而無信,不知其可;企業無信,則難求發展;社會無信,則人人自危;政府無信,則權威不立”。推進社會信用體系建設,對于加強事中事后監管、創新社會治理方式具有重大意義,是轉變政府職能、推進國家治理體系和治理能力現代化的重要手段。

信用時代,征信為基!征信體系建設作為社會信用體系建設的基礎性工程,主要負責采集、加工、分析和對外提供社會主體信用信息服務,對于消除買賣雙方信息不對稱、防范信用風險具有重要意義。我國目前已經初步形成了國家金融信息基礎數據庫與市場化征信機構錯位發展、功能互補的市場格局,覆蓋全社會的征信體系初步建立。征信體系建設在消除交易雙方信息不對稱、防范系統性金融風險發揮了不可替代的重要作用。

與此同時,我國征信體系建設在推進進程中也面臨著諸如信用信息數據歸集種類單一、體系之間存在信息壁壘、信用信息低水平、低層次共享等諸多現實問題。隨著我國移動支付、互聯網金融、共享經濟的蓬勃發展,新興產業也給征信體系建設提出了新要求、帶來了新挑戰。我國征信業發展若滯后于國內近萬億的消費金融市場,將大大制約我國社會信用體系的進一步發展。

一、征信困境分析

(一)信息采集標準不統一

以政府間的信息收集標準來看,不同的政府部門采用不同的數據存儲格式,在傳輸過程中采用不同的數據接口、接口參數,導致歸集之后的數據格式各異,從而引發數據質量差、可利用率低,數據丟失、失真、雜亂無章等問題。確定一個合理的信息標準,以確保信息的統一性、容錯性和可利用率,是一個亟待解決的問題。

例如,目前信用城市建設排名第一的蘇州信用平臺收錄的行政許可大約有60.5萬余條,但在“日期”的標注上,有的許可文件有明確的發證日期和生效日期,有的只有發證日期或者使用日期,而其他信息收集的情況更是雜亂無章[1]

同時在省市兩級數據征集模式中,中央部門會對其垂直管理部門進行信用數據的歸集和管理,省級信用信息共享交換平臺也會對橫向各個職能廳局以及下級政府的信用數據進行歸集整合,從而形成中央部門與地方平臺相關信用數據多渠道采集、重復采集、多重管理的“條塊問題”,進而造成“一數多源”的局面。而在多個來源數據不一致時,就會出現“以誰為準”的難題。而這將極大程度上影響后續數據處理的準確性及可實踐性。

(二)信息采集范圍狹窄

央行征信系統中的個人信用信息主要是信貸信息,也包括例如公積金繳存、行政處罰、稅務等公共信息。但截至 2014 年底,個人征信系統采集 8 類公共信息共計 2.59 億賬戶信息,與12.52 億信貸信息賬戶數相比,僅占全部數據量的 20.69%,而信貸信息占79.31%[2],如圖1

1 2014 年底個人征信系統反映信用狀況的信息采集情況

注:其他信息包括法院判決和執行信息、低保救助信息、車輛抵押交易信息、

執業資格信息和獎懲信息等。

數據來源:人民銀行征信中心《征信系統建設運行報告(2004--2014)》,2015年。



在信用城市建設過程中,失信信息范圍進一步擴大,如《杭州市公共信用信息管理辦法》將提供虛假材料、違反告知承諾制度的信息;以欺詐、偽造證明材料或其他手段騙取社會保險信息;乘坐公共交通工具時冒用、偽造證件乘車等逃票信息,納入失信信息范圍。

信用信息未來將不再局限于金融借貸信息這些強相關數據。首先,很多沒有借貸記錄的個人無法進行信用評估;其次,納入如消費記錄、社交情況、資產狀況以及諸如職業、學歷等身份信息,將更好描繪個人的信用歷史、履約能力等信用維度。

當然,在信用信息采集種類擴大的過程中也要兼顧個人隱私保護問題。由于個人信用信息與個人隱私的邊界問題尚不明確,加上我國未制定統一的個人信息保護法,征信就極易觸碰個人隱私問題。因此,種類擴大需要有一個邊界,不可能無限地擴大,需要進行立法加以約束。

(三)信息交換共享存在壁壘

隨著互聯網和信息行業的發展,海量信用信息爆炸式出現并被記錄,但由于數據資源屬于核心競爭力,其在不同部門相互獨立存儲、獨立維護、彼此間相互孤立,形成了一個個的“數據孤島”,即便達成共享,也無法避免低水平、低層次的現象,極大限制了對信用數據的有效利用。總結起來,數據孤島的困境有以下表現形式:

1.體系間信息互換模式不統一

據上海資信調研,由于信用信息涉及個人信息保護問題,再加上信息數據是核心競爭力,所以想要獲得數據,必須以其他的數據進行互換。但是不同征信體系內有著不同的互換規則,導致信息在不同持有者之間流通閉塞。

金融征信體系中通過立法固定流通模式。央行征信部門通過《征信業管理條例》及《個人信用信息基礎數據庫管理暫行辦法》收集各大商業銀行的信貸信息,并且將政務公開中的信用信息加以匯總,制作個人征信報告,商業銀行通過用戶授權,查詢用戶的個人征信報告。

商業征信系統是通過市場化信息共享協議實現數據流通。八大征信公司的數據來源主要是股東公司的信貸業務,其次是與其他商業機構合作,簽訂共享協議。百行也是通過協議方式接入其他平臺數據,進行數據的采集、處理,然后在接入平臺間進行有條件的提供。

公共征信體系主要依靠各級信用信息共享平臺建設,政府在征信體系建設中更多承擔信用信息數據提供者作用,雖然多省市出臺的公共信用信息管理法規均明確了“鼓勵信用服務機構查詢使用公共信用信息”,但在實踐中由于我國征信立法相對較滯后且未建立完備的公共信用信息數據流通交易機制,導致我國目前多數信用信息共享平臺還未與市場征信機構進行合作與對接。

這樣產生的問題就是,首先,信息的頻繁流動會導致信息泄露的可能性變大。其次,市場征信機構想要獲得行政機構手中對于至關重要的數據面臨著弱勢地位,因為沒有嚴格的上位法規進行授權,難以獲取。再者,通過協議方式交換數據并限制其成員對外提供數據,造成了數據的“僵化”。最后,地方政府在建立信用信息共享平臺時難以將全國范圍內擁有信用信息的數據存儲單位全部納入,并提供自己所需要的本地區人民的信用信息。

2.信用信息數據質量差、可利用率低

目前,各級地方政府都陸續出臺相關公共信用信息管理辦法,例如《北京市公共信用信息管理辦法》等,但由于國家在宏觀層面對歸集信用信息數據時沒有統一標準規范,導致不同的政府部門對信用信息分類標準、采集種類均有所不同,如福建省將個人信用信息分為基本信息、良好信息、提示信息和警示信息四類,而上海市又將個人信息分為基本信息、失信信息、其他信息三類;[1]并且不同地方政府在上傳數據時采用不同的數據存儲格式,在傳輸過程中采用不同的數據接口、不同的接口參數,導致歸集之后的數據內容與格式各異,從而導致數據質量差、可利用率低,數據丟失、失真、雜亂無章等問題。

信用信息數據收集的另一難點在于缺乏實時更新,許多垂直管理政府部門(如工商、司法、稅務等)的信用信息都采用數據集中交換模式、集中統一存儲和共享,這就導致有些數據不能及時歸集,進而出現嚴重的數據脫節,造成數據更新慢、不及時的現象。

3.缺乏宏觀政策指引及調控

首先中央未對數據交換做出相應規范,并且缺乏中央層面的統籌機構,僅央行征信管理局并無足夠的職權要求其他政府部門以及商業機構提供其數據。其次,政府間信息共享平臺的授權標準有些許模糊。再者,《征信業管理條例》等相關法規限制了央行等征信系統向外提供個人信用信息,使商業機構難以獲取強相關的金融借貸信息。最后,無論是政府間信息共享平臺、央行及百行數據庫抑或政府部門,其沒有進行信用信息共享的動力。

標準的不統一,直接導致采集信息后不能得以有效匯總及處理,征信平臺取得數據后進行大量清洗也不能得到有效的信用信息;同時采集種類過于狹窄導致超過半數的公民因缺乏信貸歷史而難以獲得充分的金融服務;數據孤島直接制約了征信業的進一步擴大。

二、困境破除的最新嘗試

20183月,百行征信公司成立,吸收原有八家民間征信公司的業務,成為了國內唯一一個持有牌照的市場征信公司。同時興起于2017年的信用城市也是發展迅速,以蘇州、福州、宿遷為代表的信用城市在個人征信行業提供了新的理論思路和實踐做法。百行征信與信用城市都是在《社會信用體系建設規劃綱要20142020》的領導下,對征信業的困境進行破除的實踐。

(一)百行征信對征信困境的破除之處

百行征信公司,打破了央行征信中心“壟斷”全國商業銀行個人信用信息使用權的局面,

為中國征信行業引入了多元化的市場主體,整合原有八家征信公司的個人征信業務,主要收集互聯網金融經濟所產生的新型信用信息。

1.擴大采集種類

目前國內信用信息收集的格局如下:行政機關與司法機關掌握的個人在履行法定義務過程中形成的負面信息,由征信機構通過公共信用信息共享平臺等實現覆蓋;銀證保等傳統金融領域的信用信息,由央行征信中心的金融信用信息基礎數據庫實現覆蓋;銀證保等傳統金融機構之外,特別是小貸公司、互聯網金融、電商等新興領域的征信信息,由市場化征信機構實現覆蓋,主要負責覆蓋的公司正是百行征信公司。雖然百行的定位也是信貸信息,但其主要針對的是互聯網金融興起所產生的互聯網金融借貸信息。百行的成立,有效的整合了市場上零散的互聯網金融信息,其所形成的數據庫將作為央行信用信息數據庫的重要補充。

2.統一信息標準

在數據收集階段,百行征信對數據收集以及接口系統等統一了接入標準,所有接入機構必須按照一定標準,成熟一個接入一個,逐步擴展。其所施行的標準,主要參照了央行的《個人信用信息基礎數據庫數據接口規范》。數據的處理階段,將收集到的統一標準的數據進行進一步的清洗及加工,最后推出統一的征信報告,從而進一步解決征信業標準不統一的問題。

3.推進信息共享

在共享數量上,百行征信系統已經通過信息共享協議的方式,接入了200多家網貸公司、8000多家縣域的小貸公司、消費金融公司等,涵蓋P2P網貸公司、網絡小額貸款公司、消費金融公司、汽車金融公司,融資租賃公司、民營銀行、助貸機構、金融科技公司等上萬家數據存儲單位。百行有效的解決了互聯網經濟時代下所帶來的是“不愿意共享、無法實現共享”的問題,高效率的整合了市場上大量互聯網公司的優先數據,打破原有的數據孤島,極大的推進了互聯網金融信用信心數據的共享。在共享對象上,百行的服務對象主要是眾多小額貸款公司以及新興的互聯網金融借貸平臺等非持牌機構,極大的滿足了其市場需求,打破了央行對外封閉的局面。

但同時,面對其“準官方化”的性質,以及個人征信市場審批制的較高準入門檻,相當長一段時間內幾乎不存在任何對手的百行,就可能會帶來信息獨占及寡頭壟斷問題,這就要求國家從立法等多方面加強監管。

(二)信用城市建設

信用城市作為剛剛起步的征信業新實踐,國家賦予了各地信用城市建設極大的自主權,因此信用城市的建設做法不一,各地發展狀況也有較大的差異。截至2018年底,國內涌現出了以蘇州、福州、宿遷等為代表的優秀信用城市,其在信息的種類擴大、信息的標準統一、信息的共享機制建設方面均取得了不錯的成就,為征信業困境的破除提供了重要的借鑒意義。

1.信息數據多樣

信用城市的建設要求政府在原有的金融信息的基礎上,盡可能多的收集能夠反映個人社會誠信的信息。為此,各地采取了不同的做法,但大體上均是通過制定地方個人征信條例的方式,確定信息的類型,其中包括但不限于個人基本信息、金融借貸信息、公共事業信息、司法判決信息、行政處罰與行政強制信息、通信信息等。

例如浙江省義烏市為擴充數據種類,全面反映個人信用信息,采取了一系列有效措施擴大個人信用信息的類型。不僅全面采集行政許可、行政處罰、榮譽、評價等級等信用信息,納稅額、社保、公積金、水電氣繳費等數據也被納入個人信用信息的范圍中;同時創新開展電商信用檔案建設,實現信息收集線上線下的結合。

2.加強信息共享
   
信用城市通過立法和頒布配套措施的方式,打破原有的數據孤島,加快信息的共享和流通。信用城市建設走在前列的城市在信息壁壘的破除上成效顯著,如福州市已有422家信用單位通過電子政務外網接入平臺,實現了信用信息資源的實時共享;榮成市社會信用管理系統,設立了黨政機關、社會法人、自然人、村居組織4個數據庫,與所有部門單位和鎮街聯網共享,成為全國首個將黨政機關、村居組織納入信用管理的城市[2]

 3.個人信用法律保障

信用城市的建設過程中,不論是數據的收集、處理、共享,還是數據的應用、個人信息保護和其對應的法律責任,都通過立法的方式進行規制,以保障信用城市建設的過程中,政府的行為有法可依,避免行政權過于干涉公民基本權利,有效避免征信過程中錯誤與瑕疵的出現。除此之外,信用城市建設的過程中還積極采取市場主體信用承諾簡化審批模式,對不良信用記錄的申請人在實施信用承諾后實行先證后核、現場發證,對信用制度建立、實行和公開力度大。如鞍山市推出了《“雙承諾制”審批暢通“最后一公里”》,宿遷市提出《宿遷市啟動信用承諾簡化審批試點工作》。

三、對策及建議

百行及信用城市的建設為突破征信困境做了諸多的嘗試,然而由于僅憑其一己之力難以對整個征信市場造成決定性的影響,諸如標準不一、數據質量差及數據孤島的問題依舊難以得到解決。項目組成員通過大量調研并結合數學及計算科學的最新進展,從數據的歸集、數據的處理、數據的共享三方面進行討論,以期推動征信業的進一步發展。

(一)數據的歸集層面

1.提供數據準確性

解決數據質量差、雜亂無章等問題應制定統一的數據收集標準,以統一的社會信用代碼為基礎,建立全國統一的公共信用信息目錄標準、系統建設標準、信息安全技術標準和信用行業服務標準。最重要的是定義標準元數據和標準元數據目錄,以消除不同部門、地區數據的歧義性。在制度層面,數據征集模式上解決一數多源重復采集問題的重要思路是以條塊結合、相互補充為原則加以推進,以實現全面歸集和管理信用信息。即是基礎,以中央部門垂直采集的信用信息為主要數據源,而為重要補充,當中央部門采集信息不齊或渠道尚未完整建立時,地方平臺采集的橫向職能部門信用信息數據將成為有效補充。同時,中央部門數據和地方平臺數據還可進行比對、校核,提高數據的準確性。

2.建立公共信用信息開放與共享利益補償機制

信用信息共享程度低主要是受體制、部門利益的影響,信息資源獨有專享的權屬觀念在各個部門不同程度存在,部分部門認為自己提供的數據價值、歸集成本要遠高于共享利益,由此產生了不愿共享、共享信息質量不高等問題。

在這方面,美國是采用完全市場化的私營征信模式,獨立于政府,主要以盈利為目的對外提供有償征信服務,依托大量信息采集及共享協議,收集并提供信用數據,實現數據的有效共享,政府主要是制定相關法律規范私營征信機構的發展方向,保護信息主體的合法權益。然而中國出于保護個人信息權益的目的,不能全部照搬此模式。

解決該問題應驅動部門共享內部動力和加以外部約束。在內部機制上,政府在決策時,應考慮數據價值、歸集成本等因素,通過建立適當的利益補償機制體現數據自身價值,以數據數量、質量、使用率等為參考,給予信息提供部門適當的經濟補償,以調動其共享開放信用信息的積極性。對社會上提供信息和數據的電商、中介機構等,給予適當的經濟補償。積極借鑒市場模式,推行適當的信息共享激勵政策,通過價值補償等方式鼓勵市場數據與政府數據交換共享。

另一方面,完善外部約束機制也是一重要措施。信用信息的互聯互通、共建共享不應只停留在口號與宏觀目標層面,政府在具體政策文件中應當明確責任主體,加強對信用信息共享的監管。如山西省就曾提出將政務信用息的歸集共享工作納入對各級政府部門年終考核的指標之中。這樣就能較好突破來自部門利益關系的障礙,受各部門的主觀隨意性影響較小。

3.開放數據接口

個人信用信息存儲在不同的征信機構中,有些限于《征信業管理條例》難以向其他征信機構提供數據服務。因此有資質并符合互聯網三級安全要求的征信機構,可以在網站或相關平臺提供數據接口,通過用戶驗證及授權,獲取其在其他征信機構中的信用信息,而后進行清洗及處理,擴大數據采集類型及廣度。但是在獲取用戶個人征信報告進行有效評估后,應直接刪除不進行留存,更好保護個人信息安全。

4.自主申報

數據的歸集在碎片化的當下,單獨依靠一個平臺或一個企業,勢必難以收集到全面且完整的信息,因此自主申報將有效解決此問題,用戶可通過按格式提交自己的信用信息及相關證明材料,由工作人員對不符合格式的信用材料進行人工篩查,從而得到用戶完整的信用報告,同時,開放在線異議機制,盡快解決所出現的問題。

(二)數據的處理層面

1.數據變換

數據形式的多樣化,造成了一個數據接收和分析上的困難,針對這個問題,可以對數據進行變換,使數據統一規范化,適用于數據挖掘。具體方法及適用情況歸納如下:

 

轉換方法

對數轉換

平方根轉換

平方根反正弦轉換

平方轉換

倒數轉換

 

 

 

適用情況

1.部分正偏態資料

2.等比資料

3.各組數值和均值比值相差不大的資料

 

1.服從泊松分布的資料

2.輕度偏態資料

3.樣本的方差和均數呈正相關的資料

 

1.變量所有個案為百分數,并且取值廣泛的資料

1.方差和均數的平方呈反比

2.資料呈左偏

 

1.平方轉換相反,需要方差和均數的平方呈正比,但倒數轉換需要資料中沒有接近或者小于零的數據

數據轉換方法及適用情況表

 

2.數據清洗

從采集的數據內容上來看,其中有相當一部分數據重復贅余,甚至殘缺錯誤,它們均被稱為是臟數據。這些臟數據的出現大大增加了數據挖掘的難度,也降低了數據的精確程度。據此,可以利用有關技術數理統計數據挖掘或預定義的清理規則將臟數據轉化為滿足數據質量要求的數據。具體的一個數據清理模型是將數據輸入到數據清理處理器,通過設定好的一些程序代碼清理數據,然后以期望的格式輸出清理過的數據。[3]如圖2

數據清理原理



3.數據分類

對數據進行一個有效的揀取之后,為使零散的數據信息專門化,構成一個統一的邏輯架構,提高數據使用效率,數據分類是其中一個較為必要的步驟。至于有關數據分類的方法,有傳統方法如線性判別法、貝葉斯分類器,現代方法有神經網絡ANN、支持向量機SVM,可以根據需要進行選擇。

4.維度歸約

由于所獲數據量較為龐大,數據整理分析起來較為困難,我們可以對所獲數據進行更深層次的簡化,在保證所需數據的完整性的情況下,剔除部分相關性不強的數據。這主要可以從兩條途徑出發,即屬性選擇和數據采樣,在屬性選擇方面,可以采取主成分分析法來確定所需的數據指標;數據采樣方面,可以采取樣本歸約的方法,從數據集中選出具有代表性的樣本的子集。經過歸約后的數據集,能夠產生幾乎相同的分析結果,并大大提高了挖掘速度。

主成分分析步驟如下:

1.  將原始數據按行排列組成矩陣X

2.  X進行數據標準化,使其均值變為零

3.  X的協方差矩陣C

4.  將特征向量按特征值由大到小排列,取前k個按行組成矩陣P,通過計算Y = PX,得到降維后數據Y

5.  用下式計算每個特征根的貢獻率Vi;Vi=xi/(x1+x2+........)

6.  根據特征根及其特征向量解釋主成分物理意義

神經網絡模型在數據處理各步驟中運用較為頻繁,因此,對其做一個簡單介紹如圖3

IMG_256

神經元數學模型

 

注:神經網絡是由大量的、簡單的處理單元(稱為神經元(上述模型))廣泛地互相連接而形成的復雜網絡系統,它反映了人腦功能的許多基本特征,是一個高度復雜的非線性動力學習系統。其具有大規模并行、分布式存儲和處理、自組織、自適應和自學能力,特別適合處理需要同時考慮許多因素和條件的、不精確和模糊的信息處理問題。

(三)數據的交換共享層面

1.商業機構之間交換共享

商業機構之間的數據交換共享屬于市場交易范圍內的,應充分發揮市場在資源配置中的決定性作用,但另一方面由于我國征信市場發展不成熟且起步較晚,部分處于優勢地位的征信機構較易達成橫向壟斷協議進而排除、限制競爭,這就需要需要政府進行市場規制,對信用信息交易行業進行一定價格管制,發揮看得見的手的作用。

信用信息的市場價格既要覆蓋成本,又要考慮效益。信用信息的價格不僅包括維持征信機構長期運行的固定成本、可變成本、存儲成本,還要給供需雙方必要的利潤空間,以形成價格驅動機制,促進征信市場的良性發展。

2.央行與第三方機構交換共享

央行采集了來自商業銀行、政府機關企事業單位以及個人的大量信用信息,央行與外部機構交換共享較少的主要原因是成本與收益的不對稱,即央行在數據歸集、處理所付諸成本及信用信息數據價值要遠大于外部接入數據價值。

央行的定價應滿足兩個原則。一是公益性原則。央行提供的是一種不具有競爭性和排他性的準公共產品,數據價格不宜過高。第三方機構采集信用信息的成本最終會歸于用戶,而低定價則讓用戶以較低的成本享受到較為專業的信息服務,無疑會提高央行征信中心的使用頻率,擴大征信市場的需求。二是成本定價原則。征信行業是固定成本較高,而邊際成本幾乎為零的行業,在系統的建設初期需要投入大量的資金及技術,同時花費監督管理等行政費用。央行系統的建設不以盈利為目的,而是以成本定價原則,使成本和收益相平衡,一方面可以緩解系統運營成本的壓力,另一方面可以提高系統的使用效率。

3.信用信息的對外公示

信用信息對外公示程度偏低的主要原因是個人隱私與個人信用信息的邊界界定模糊,由此產生的信用信息公開法律風險讓部分職能部門不敢公示、不想公示。解決該類問題的重要方法是建立完善信用信息分類分級管理制度,通過總結已有分類分級方法理清信息公開與隱私保護的關系,明晰失信行為的范圍,可以將信用信息分為基本信息、良好信息、警示信息、失信信息等。更好降低信用信息公示風險,也能促進公開程度。

四、結語

《社會信用體系建設規劃綱要20142020》為我國下一步社會信用體系的建設提供了發展的方向。各地方政府頒布相關政策性文件和出臺配套措施,加快地方社會信用體系的建設。但是在征信的過程中,由于缺乏相關的法律文件和政策性規定,信息種類過于狹窄、信息標準不統一、共享機制不健全等征信困境逐漸出現,成為了社會信用體系建設的障礙。

百行與信用城市的出現,對當前征信業困境做出了一定的突破,但尚未完全解決上述難題。從根源上來看,上述問題是立法不完善、政策不足所導致的,而破除困境的方式,除完善立法、出臺相關政策以外,采用新型數據處理技術、構建健全的政府間信息共享平臺也是解決之策。

建設中國特色社會信用體系,從信息的收集、處理、共享、應用四個層面構建完善的個人征信機制,需要政府的主導和市場的參與。通過立法明確信用信息類型和信息標準,頒布政府間信息共享的政策文件,明確百行的定位和權限,完善信用城市建設,從而全方面的完善個人社會信用體系的建設,為信用經濟服務,促進信用經濟的發展和繁榮。在2020年社會信用體系建設規劃之年的到來之際,為中國征信業揚帆助力!

3.數據分類

對數據進行一個有效的揀取之后,為使零散的數據信息專門化,構成一個統一的邏輯架構,提高數據使用效率,數據分類是其中一個較為必要的步驟。至于有關數據分類的方法,有傳統方法如線性判別法、貝葉斯分類器,現代方法有神經網絡ANN、支持向量機SVM,可以根據需要進行選擇。

4.維度歸約

由于所獲數據量較為龐大,數據整理分析起來較為困難,我們可以對所獲數據進行更深層次的簡化,在保證所需數據的完整性的情況下,剔除部分相關性不強的數據。這主要可以從兩條途徑出發,即屬性選擇和數據采樣,在屬性選擇方面,可以采取主成分分析法來確定所需的數據指標;數據采樣方面,可以采取樣本歸約的方法,從數據集中選出具有代表性的樣本的子集。經過歸約后的數據集,能夠產生幾乎相同的分析結果,并大大提高了挖掘速度。

主成分分析步驟如下:

1.  將原始數據按行排列組成矩陣X

2.  X進行數據標準化,使其均值變為零

3.  X的協方差矩陣C

4.  將特征向量按特征值由大到小排列,取前k個按行組成矩陣P,通過計算Y = PX,得到降維后數據Y

5.  用下式計算每個特征根的貢獻率Vi;Vi=xi/(x1+x2+........)

6.  根據特征根及其特征向量解釋主成分物理意義

神經網絡模型在數據處理各步驟中運用較為頻繁,因此,對其做一個簡單介紹如圖3

IMG_256

神經元數學模型

 

注:神經網絡是由大量的、簡單的處理單元(稱為神經元(上述模型))廣泛地互相連接而形成的復雜網絡系統,它反映了人腦功能的許多基本特征,是一個高度復雜的非線性動力學習系統。其具有大規模并行、分布式存儲和處理、自組織、自適應和自學能力,特別適合處理需要同時考慮許多因素和條件的、不精確和模糊的信息處理問題。

(三)數據的交換共享層面

1.商業機構之間交換共享

商業機構之間的數據交換共享屬于市場交易范圍內的,應充分發揮市場在資源配置中的決定性作用,但另一方面由于我國征信市場發展不成熟且起步較晚,部分處于優勢地位的征信機構較易達成橫向壟斷協議進而排除、限制競爭,這就需要需要政府進行市場規制,對信用信息交易行業進行一定價格管制,發揮看得見的手的作用。

信用信息的市場價格既要覆蓋成本,又要考慮效益。信用信息的價格不僅包括維持征信機構長期運行的固定成本、可變成本、存儲成本,還要給供需雙方必要的利潤空間,以形成價格驅動機制,促進征信市場的良性發展。

2.央行與第三方機構交換共享

央行采集了來自商業銀行、政府機關企事業單位以及個人的大量信用信息,央行與外部機構交換共享較少的主要原因是成本與收益的不對稱,即央行在數據歸集、處理所付諸成本及信用信息數據價值要遠大于外部接入數據價值。

央行的定價應滿足兩個原則。一是公益性原則。央行提供的是一種不具有競爭性和排他性的準公共產品,數據價格不宜過高。第三方機構采集信用信息的成本最終會歸于用戶,而低定價則讓用戶以較低的成本享受到較為專業的信息服務,無疑會提高央行征信中心的使用頻率,擴大征信市場的需求。二是成本定價原則。征信行業是固定成本較高,而邊際成本幾乎為零的行業,在系統的建設初期需要投入大量的資金及技術,同時花費監督管理等行政費用。央行系統的建設不以盈利為目的,而是以成本定價原則,使成本和收益相平衡,一方面可以緩解系統運營成本的壓力,另一方面可以提高系統的使用效率。

3.信用信息的對外公示

信用信息對外公示程度偏低的主要原因是個人隱私與個人信用信息的邊界界定模糊,由此產生的信用信息公開法律風險讓部分職能部門不敢公示、不想公示。解決該類問題的重要方法是建立完善信用信息分類分級管理制度,通過總結已有分類分級方法理清信息公開與隱私保護的關系,明晰失信行為的范圍,可以將信用信息分為基本信息、良好信息、警示信息、失信信息等。更好降低信用信息公示風險,也能促進公開程度。

四、結語

《社會信用體系建設規劃綱要20142020》為我國下一步社會信用體系的建設提供了發展的方向。各地方政府頒布相關政策性文件和出臺配套措施,加快地方社會信用體系的建設。但是在征信的過程中,由于缺乏相關的法律文件和政策性規定,信息種類過于狹窄、信息標準不統一、共享機制不健全等征信困境逐漸出現,成為了社會信用體系建設的障礙。

百行與信用城市的出現,對當前征信業困境做出了一定的突破,但尚未完全解決上述難題。從根源上來看,上述問題是立法不完善、政策不足所導致的,而破除困境的方式,除完善立法、出臺相關政策以外,采用新型數據處理技術、構建健全的政府間信息共享平臺也是解決之策。

建設中國特色社會信用體系,從信息的收集、處理、共享、應用四個層面構建完善的個人征信機制,需要政府的主導和市場的參與。通過立法明確信用信息類型和信息標準,頒布政府間信息共享的政策文件,明確百行的定位和權限,完善信用城市建設,從而全方面的完善個人社會信用體系的建設,為信用經濟服務,促進信用經濟的發展和繁榮。在2020年社會信用體系建設規劃之年的到來之際,為中國征信業揚帆助力!

(作者:湘潭大學 顧男飛 左添熠 劉奕辰 謝心怡



                                                                                                               (聲明:文章內容由作者提供,僅代表作者個人觀點。)


9.30福彩中奖号码 北京pk10是国家彩票吗 热血江湖手游容易赚钱吗 湖南幸运赛车直播现场 点指成金怎样快速赚钱 新疆11选5开奖结果彩经网 湖南幸运赛车直播 北京pk10怎么看号 炒股票软件 韩国快乐8开奖结果 双色球蓝球高%比公式 安徽十一选五一定牛 湖南幸运赛车开奖结果 网上做点啥赚钱 河南十一选五走势图表 2018网上收徒赚钱软件 沪市股票指数