“信而有征”指可驗(yàn)證其言為信實(shí),或征求、驗(yàn)證信用。在美國生活了16年的顧凌云了解科技如何給美國金融業(yè)錦上添花,它們的觸角深入到全國各地,服務(wù)下沉到各行各業(yè)。帶著在美國知名金融科技公司ZestFinance和Kabbage的創(chuàng)業(yè)和工作經(jīng)驗(yàn),顧凌云回到中國創(chuàng)辦冰鑒科技,他相信美國的經(jīng)驗(yàn)在中國同樣適用,“金融本質(zhì)就是存取匯兌付,無論你在南非開普敦,中國南京,還是美國洛杉磯,任何金融機(jī)構(gòu)都不能避開這五樣?!?/p>
精通金融、大數(shù)據(jù)和機(jī)器學(xué)習(xí)的計(jì)算機(jī)博士顧凌云是位對(duì)人文歷史哲學(xué)有研究的理工男。他給公司取名“冰鑒”——出自曾國藩著述的一部關(guān)于相人識(shí)人的作品《冰鑒》。在顧凌云看來,曾國藩相人識(shí)人的學(xué)問和冰鑒科技用大數(shù)據(jù)搜集小微企業(yè)方方面面的信息并對(duì)它們做出信用評(píng)估有相似之處。
今天,我們邀請(qǐng)到峰瑞資本互聯(lián)網(wǎng)金融領(lǐng)域早期項(xiàng)目負(fù)責(zé)人趙治遠(yuǎn)(zzy@freesvc.com)和顧凌云(gu_lingyun@icekredit.com)來一場(chǎng)AskMeAnything。他們的話題包括美國的金融科技長什么樣、中國大數(shù)據(jù)征信的創(chuàng)業(yè)機(jī)會(huì)在哪里,以及如何提升競(jìng)爭力。
顧凌云
美國金融先行者眼中的中國金融機(jī)會(huì)
趙治遠(yuǎn):互聯(lián)網(wǎng)金融火了好幾年,創(chuàng)業(yè)公司們前仆后繼。你之前是做什么的,對(duì)互聯(lián)網(wǎng)金融行業(yè)有哪些了解?
顧凌云:我本科在電子科技大學(xué),后在美國卡耐基梅隆大學(xué)計(jì)算機(jī)學(xué)院獲得計(jì)算機(jī)碩士和博士學(xué)位。畢業(yè)后我去了華爾街加入半透明資本,做對(duì)沖基金中高頻交易的算法工程師。兩年多后,我作為第6名創(chuàng)始成員加入ZestFinance,從零開始搭建模型組團(tuán)隊(duì),三年里為ZestFinance開發(fā)了六代模型,也幫助它完成三輪共5400萬美元融資。離開ZestFinance后,我在Kabbage做了三四個(gè)月的首席數(shù)據(jù)科學(xué)家。Kabbage是美國一家新興的做小微企業(yè)征信和借貸的機(jī)構(gòu),估值已超過10億美金。
之后我認(rèn)識(shí)了李豐并成為IDG駐場(chǎng)企業(yè)家(EIR),我每個(gè)月都在中美往返,在美國看機(jī)器學(xué)習(xí)相關(guān)的項(xiàng)目,在中國則看互聯(lián)網(wǎng)金融項(xiàng)目。
到2015年6月左右,我觀察了近兩年的中國金融市場(chǎng),覺得中國征信的氛圍開始形成。我創(chuàng)立冰鑒科技,主攻小微企業(yè)征信。因?yàn)樾∥⑵髽I(yè)對(duì)個(gè)人股東需要征信,所以也包括了部分個(gè)人征信業(yè)務(wù)。
趙治遠(yuǎn):你在美國的職業(yè)經(jīng)歷光鮮成功,是什么讓你下決心回國,覺得在中國做互聯(lián)網(wǎng)金融創(chuàng)業(yè),尤其在征信方面是有希望的?
顧凌云:先簡單說說中美金融發(fā)展的區(qū)別。在中國,我們叫互聯(lián)網(wǎng)金融,到底是互聯(lián)網(wǎng)為主金融為輔,還是互聯(lián)網(wǎng)作為一個(gè)形容詞來修飾金融,有很大的爭論。
但是,在美國沒有InternetFinance這種叫法,而叫Financialtechnology,簡稱Fintech。
顯而易見是把金融作為一種應(yīng)用,而實(shí)際的主體掛靠在科技上。這點(diǎn)對(duì)我回國創(chuàng)業(yè)有很大的影響。
我在美國生活了16年,美國的金融服務(wù)體系以銀行業(yè)為主導(dǎo),也有號(hào)稱“四大銀行”,花旗、大通、美國銀行和富國銀行,和中國的工農(nóng)中建四大銀行類似,它們的觸角伸到了全國各地。不同的是,它們的下沉業(yè)務(wù)非常多。有數(shù)據(jù)顯示,在中國,小微企業(yè)在銀行中能夠借貸成功的批準(zhǔn)率低于2%,相反美國富國銀行的小微企業(yè)貸款批準(zhǔn)率超過了35%,并且壞賬率極低。
此外,美國的金融環(huán)境不限于四大國有銀行,美國還有社區(qū)銀行或村鎮(zhèn)信用社,它們的服務(wù)對(duì)象甚至包括被傳統(tǒng)銀行業(yè)排斥的人。也恰恰如此,在美國,如果初創(chuàng)公司想在商業(yè)模式為主導(dǎo)的金融領(lǐng)域取得革命性進(jìn)展幾乎不可能,更多的是基于金融做技術(shù)創(chuàng)新。而在中國,傳統(tǒng)金融機(jī)構(gòu)線下服務(wù)的人群或者解決方案都遠(yuǎn)遠(yuǎn)沒有達(dá)到令人滿意的程度,也就是說,在中國,純粹金融領(lǐng)域上的創(chuàng)新仍有很大空間。
這是促成我回國的一個(gè)原因,整個(gè)中國目前金融體系服務(wù)對(duì)象的寬度不夠,產(chǎn)品的縱深度不夠,這給了我們機(jī)會(huì)。
第二點(diǎn)更加重要,2008年以后,美國金融體系在收緊,而中國金融在去監(jiān)管化。在一個(gè)希望有金融和高科技創(chuàng)新的領(lǐng)域,去監(jiān)管化是個(gè)利好。
第三點(diǎn),中國在慢慢轉(zhuǎn)型,由商業(yè)模式驅(qū)動(dòng)的企業(yè)后繼乏力,以高科技為驅(qū)動(dòng)的企業(yè)越來越多。且中國的知識(shí)產(chǎn)權(quán)保護(hù)也越來越好,讓我們這些以高科技為驅(qū)動(dòng)的公司更有動(dòng)力。在中國做一家以高科技為驅(qū)動(dòng),以商業(yè)模式創(chuàng)新為輔的征信企業(yè)是可行的。
趙治遠(yuǎn):你覺得中美互聯(lián)網(wǎng)金融最大的共通性是什么?
顧凌云:金融本質(zhì)就是存取匯兌付,無論你在南非開普敦,中國南京,還是美國洛杉磯,任何金融機(jī)構(gòu)都不能避開這五樣。
與此同時(shí),金融作為整個(gè)社會(huì)和經(jīng)濟(jì)發(fā)展最大的驅(qū)動(dòng)力,社會(huì)的造血功能由它開始,所以中美兩國的金融在商業(yè)模式上差異不是特別大,發(fā)展大方向上幾乎一樣。所以我們?cè)诿绹畮啄甑慕鹑诮?jīng)驗(yàn)可以比較完整的移植到中國來。
趙治遠(yuǎn):也就是在美國見過了“豬是怎么跑的”,回到中國來做“風(fēng)口上的豬”。
互聯(lián)網(wǎng)金融領(lǐng)域的BBC模式
趙治遠(yuǎn):冰鑒科技是怎么切互聯(lián)網(wǎng)金融的?你們的商業(yè)模式是什么?
顧凌云:用一句話來概括,冰鑒科技以大數(shù)據(jù)和機(jī)器學(xué)習(xí)算法為驅(qū)動(dòng),對(duì)小微企業(yè)和個(gè)人提供征信服務(wù)。
我們的商業(yè)模式叫做B2BC,簡稱BBC,不過和英國的BBC廣播電臺(tái)沒有半毛錢關(guān)系。我們服務(wù)金融機(jī)構(gòu),所以叫toB,再由金融機(jī)構(gòu)來服務(wù)小微企業(yè)和個(gè)人借貸對(duì)象,也就是to小B和toC。
一個(gè)完整的小微企業(yè)貸款征信周期,包括對(duì)小微企業(yè)的經(jīng)營數(shù)據(jù)征信,對(duì)小微企業(yè)股東征信,還有小微企業(yè)貸后數(shù)據(jù)征信。
我們直接服務(wù)的金融機(jī)構(gòu)有四類,包括傳統(tǒng)意義上的銀行,P2P平臺(tái),小貸公司以及新興的互聯(lián)網(wǎng)金融公司。這些B端在收到小B和C的客戶申請(qǐng)后,會(huì)把他們申請(qǐng)表的部分信息和其他信息傳給我們,但是這些信息是有限的。我們用自己的觸角往上爬取,跟其他數(shù)據(jù)源合作,展開360度數(shù)據(jù)的搜集,完成數(shù)據(jù)處理、變量提純、單一和整體模型的建立,提供從黑名單到反欺詐,再到風(fēng)控的全套解決方案。
趙治遠(yuǎn):到目前為止,你們都服務(wù)了哪些客戶?
顧凌云:已經(jīng)使用產(chǎn)品并付費(fèi)的用戶有二三十家,包括2家上市股份制銀行,全國Top20的P2P平臺(tái)中的七八家,兩三家新興的拿到消費(fèi)金融牌照的公司。和小貸公司的合作更寬,我們直接跟一個(gè)省或直轄市的小貸協(xié)會(huì)合作,他們統(tǒng)一把數(shù)據(jù)交給我們,由我們建模完后給他們批量服務(wù)。
趙治遠(yuǎn):中國的商業(yè)銀行對(duì)風(fēng)控的要求是非常嚴(yán)的,允許一個(gè)第三方公司尤其是初創(chuàng)企業(yè)提供風(fēng)控服務(wù),是件聽上去很難做到。冰鑒用什么方式打動(dòng)銀行?
顧凌云:第一,高風(fēng)控意識(shí)的客戶更容易認(rèn)可我們的技術(shù)和模式。在我回到中國之前,我一直非常盲目自信樂觀地認(rèn)為我們第一批付費(fèi)客戶應(yīng)該是在技術(shù)實(shí)力上遠(yuǎn)遠(yuǎn)落后于我們、對(duì)風(fēng)控一無所知、急切需要風(fēng)控解決方案的金融機(jī)構(gòu)。實(shí)際上恰恰相反,最先跟我們簽約的是16家股份制銀行中風(fēng)控做的最好的前幾家。
越是風(fēng)控把握得好的金融機(jī)構(gòu)越容易跟我們合作,他們更清楚我們的重要性和技術(shù)優(yōu)勢(shì)在哪里,溝通成本最低。
第二點(diǎn),這不是一個(gè)主觀判斷的行業(yè),而是一個(gè)完完全全靠數(shù)字說話的行業(yè)。很多金融機(jī)構(gòu)會(huì)把他們歷史數(shù)據(jù)中擁有好壞標(biāo)簽的關(guān)鍵信息隱去,讓我們用剩下的部分?jǐn)?shù)據(jù)判斷客戶的好壞,然后客戶拿回去比對(duì)??蛻粲肒S、AUC、precision、recall等客觀量化指標(biāo)來評(píng)估,哪家的技術(shù)最好一目了然。在很多實(shí)際測(cè)評(píng)中,我們的模型各項(xiàng)指標(biāo)第一。
第三點(diǎn),各級(jí)省市政府領(lǐng)導(dǎo)給了我們極大的背書。除了風(fēng)投,我們還獲得了數(shù)量不小的地方政府的支持,對(duì)我們做上下游整合,包括數(shù)據(jù)源都提供了很大幫助。陸家嘴金融管委會(huì)從主任到工作人員對(duì)我們非常關(guān)心,我們?cè)谏虾5目偛恳呀?jīng)落戶自貿(mào)區(qū),搬入陸家嘴的金融產(chǎn)業(yè)園。我們?cè)诔V莸墓?,接待過江西省四套領(lǐng)導(dǎo)班子的一把手,包括江西省委書記和省長,還有江蘇省的兩套班子,江蘇省委書記和江蘇省長。政府的背書對(duì)我們?nèi)〉勉y行信任并簽約提供了巨大幫助。
個(gè)人征信不過是小微企業(yè)征信的子集
趙治遠(yuǎn):現(xiàn)在中國市場(chǎng)上做征信的公司都有哪幾類,冰鑒科技和他們有什么區(qū)別?
顧凌云:中國如果有100家公司號(hào)稱做征信,實(shí)際上有80家公司,也就是80%都是數(shù)據(jù)的底層提供商。在我看來,這些底層數(shù)據(jù)提供商不能夠作為核心的征信機(jī)構(gòu)存在,因?yàn)槿魏螖?shù)據(jù)源的擁有者其本身都具有要尋租和變現(xiàn)的需求。而且很多數(shù)據(jù)源都是國有企業(yè)或和政府關(guān)聯(lián)的公司的,現(xiàn)在整個(gè)中國官方的數(shù)據(jù)正在連成一片,打破“孤島效應(yīng)”,本來擁有特殊行政優(yōu)勢(shì)的數(shù)據(jù)源企業(yè)將喪失競(jìng)爭力,數(shù)據(jù)源將變成一種commodity,各家只能以價(jià)格來取得優(yōu)勢(shì),而不是有本質(zhì)上的差異。
剩下的20家中又有80%左右即16家在做個(gè)人征信。個(gè)人模型的變量,我們叫緩變量,就是說隨著人的一生改變,變量數(shù)值不會(huì)有太大改變。比如婚姻狀況只有四種,已婚、未婚、離婚和喪偶;教育水平只有七種。而且這些信息高度相關(guān),如果我知道你在什么地方畢業(yè),收入多少,我甚至都能判斷出你住的小區(qū)每平米多少錢,在什么類型公司擔(dān)任什么職位。所以,個(gè)人征信并不難做。
最后會(huì)變成比拼肌肉,誰資金更充足,獲得的數(shù)據(jù)更全面,愿意燒更多錢免費(fèi)試用,誰就會(huì)在市場(chǎng)中活下來。
我們選擇小微企業(yè)征信有以下幾個(gè)原因:
第一點(diǎn),小微企業(yè)征信的數(shù)據(jù)更加離散,技術(shù)門檻高。例如8萬條數(shù)據(jù)源已經(jīng)能做出比較好的個(gè)人征信模型,但難以做小微企業(yè)模型,因?yàn)楦餍袠I(yè)間完全不同,數(shù)據(jù)不能整合,而且小微企業(yè)受創(chuàng)始人或股東影響非常大,如果公司負(fù)責(zé)人變了,即使完全相關(guān)的歷史數(shù)據(jù)也不能統(tǒng)一建模。所以小微企業(yè)數(shù)據(jù)天然有離散性和稀疏性,導(dǎo)致在數(shù)學(xué)建模過程需要更強(qiáng)的技術(shù)實(shí)力完成。
第二點(diǎn),小微企業(yè)的數(shù)據(jù)更加豐富,我們?cè)诰W(wǎng)上可以獲得更多跟企業(yè)相關(guān)的數(shù)據(jù),包括宏觀經(jīng)濟(jì)數(shù)據(jù),跟產(chǎn)業(yè)相關(guān)的數(shù)據(jù)等等。
第三點(diǎn),中國法律法規(guī)會(huì)對(duì)個(gè)人征信的監(jiān)管會(huì)越來越嚴(yán)。在美國不能使用的很多變量現(xiàn)在在中國都可以用,例如農(nóng)村還是城市戶口,性別是男是女,年齡,種族背景等等。因?yàn)槿澜缃鹑诘幕ネㄐ裕蚁嘈胖袊姆煞ㄒ?guī)對(duì)個(gè)人征信的監(jiān)管會(huì)越來越嚴(yán),隨著監(jiān)管的加強(qiáng),個(gè)人征信的很多信息都將不能使用。但反過來,因?yàn)樾∥⑵髽I(yè)的信息本來就該是公開的,所以小微企業(yè)的征信監(jiān)管上要比個(gè)人松很多,這點(diǎn)在美國也得到了印證,這會(huì)讓我們有更多施展的舞臺(tái)。我們能使用技術(shù)能力把小微企業(yè)做為切入點(diǎn),對(duì)小微企業(yè)的經(jīng)營數(shù)據(jù)、股東、貸后數(shù)據(jù)進(jìn)行征信,完成整個(gè)小微企業(yè)貸款的生命周期。
最后,我們做小微企業(yè)可以向下兼容個(gè)人征信,但是個(gè)人征信受技術(shù)、數(shù)據(jù)等限制,無法向上兼容來完成小微企業(yè)征信。
用一句術(shù)語來講,個(gè)人征信是小微企業(yè)征信的子集,而小微企業(yè)征信是個(gè)人征信的超集。
如果順豐也來做征信?
趙治遠(yuǎn):你剛提到征信完全是個(gè)靠數(shù)字說話的行業(yè),一家大數(shù)據(jù)征信公司的核心競(jìng)爭力是在于數(shù)據(jù)的加工處理能力么,決定這些能力的因素有哪些?
顧凌云:一家以大數(shù)據(jù)為驅(qū)動(dòng)的互聯(lián)網(wǎng)金融企業(yè)的核心競(jìng)爭力絕不會(huì)在某個(gè)點(diǎn)上,至少在一個(gè)面上。這個(gè)面應(yīng)該包括多個(gè)不同的點(diǎn),在每一個(gè)緯度上取得至少20%以上的突破,才能稱自己是領(lǐng)軍性企業(yè)。
這些點(diǎn)包括,第一,對(duì)不同數(shù)據(jù)源的快速判斷。美國有1千多家數(shù)據(jù)源,傳統(tǒng)方法每一個(gè)數(shù)據(jù)源都要測(cè)試三到六個(gè)月,還要付費(fèi),1000多家數(shù)據(jù)源可能一輩子也測(cè)不完,還有大量的財(cái)政花費(fèi),我在ZestFinance帶領(lǐng)的團(tuán)隊(duì)技術(shù)上能做到對(duì)大量數(shù)據(jù)源快速遴選和判斷,光這一點(diǎn)就贏了很多企業(yè)。
第二點(diǎn),數(shù)據(jù)源確定后,你會(huì)發(fā)現(xiàn)很多數(shù)據(jù)源都是不完美的,就涉及到對(duì)缺失值的處理。對(duì)缺失值的處理包括很多,包括expectationmaximization,叫做EM對(duì)數(shù)據(jù)源的處理,包括GaussianMixtureModel,叫GMM對(duì)于數(shù)據(jù)源的處理,這些都對(duì)技術(shù)有很高要求。
第三,因?yàn)橛行┳兞恳粋€(gè)一個(gè)單獨(dú)放是沒什么用的,只有把有些變量整合在一起,才會(huì)變成指向性非常強(qiáng)的變量,這就是所謂的變量的整合和變量的選取。很多企業(yè)都把變量整合完做個(gè)單一模型就交差了。我們很多模型都是級(jí)聯(lián)完成的,有很強(qiáng)的技術(shù)、手段要求,包括如何對(duì)權(quán)重動(dòng)態(tài)評(píng)估,平行級(jí)聯(lián)還是串行級(jí)聯(lián),級(jí)聯(lián)到多少才符合要求等等。
所有這些都要取得技術(shù)突破,整合起來才能達(dá)到模型比別人好的效果。
趙治遠(yuǎn):你們的數(shù)據(jù)源主要有哪些?
顧凌云:很多,但我們不方便明確點(diǎn)出。但從宏觀上來講,對(duì)于小微企業(yè)征信,企業(yè)在互聯(lián)網(wǎng)上留存的經(jīng)營信息、企業(yè)涉訴、知識(shí)產(chǎn)權(quán)、對(duì)外投資和招聘信息,輿論對(duì)企業(yè)的看法等等,我們都通過自然語言處理的方式對(duì)接。同時(shí)我們直接跟很多政府部門進(jìn)行數(shù)據(jù)源對(duì)接,包括銀行交易流水信息、財(cái)務(wù)、稅務(wù)信息等等。我們?cè)跀?shù)據(jù)源上的廣度和深度已經(jīng)處出于領(lǐng)先地位。
對(duì)于個(gè)人征信,我們會(huì)通過社交記錄,電商存留記錄,出行記錄,法院涉訴信息等對(duì)一個(gè)人做360度的數(shù)據(jù)搜集。
我們的經(jīng)驗(yàn)和模型表明,社交數(shù)據(jù)對(duì)個(gè)人征信幾乎不管用。
我在ZestFinance就職期間曾跟Facebook和LinkedIn合作,進(jìn)入中國市場(chǎng)以后,我們經(jīng)過大量的數(shù)據(jù)統(tǒng)計(jì)建模和分析,得到了這個(gè)我們認(rèn)為比較接近于真理的真相,做個(gè)人征信的公司不妨花時(shí)間在其他數(shù)據(jù)源上。
趙治遠(yuǎn):冰鑒科技也幫助峰瑞資本的已投公司什馬金融繪制了農(nóng)民畫像,你們是怎樣在農(nóng)民信用數(shù)據(jù)和社交數(shù)據(jù)匱乏的情況下進(jìn)行信用分析的?
顧凌云:很多企業(yè)都依賴借貸方提供的數(shù)據(jù)才能建模,對(duì)人行征信報(bào)告看得也比較重。但是首先,廣大農(nóng)民普遍缺乏人行征信報(bào)告記錄;即使有,報(bào)告中的數(shù)據(jù)也很蒼白。我們就通過農(nóng)村天地當(dāng)中已經(jīng)存在的信息對(duì)農(nóng)民的信用進(jìn)行評(píng)估,比如他們使用智能手機(jī)的信息和惠農(nóng)卡的數(shù)據(jù)。
趙治遠(yuǎn):國內(nèi)的征信市場(chǎng)會(huì)如何發(fā)展,什么樣的公司最有可能走出來?
顧凌云:在美國互聯(lián)網(wǎng)征信其實(shí)比較容易做,美國有FICO和3大征信局,F(xiàn)ICO不收集數(shù)據(jù),只做征信,而三大征信局只搜集數(shù)據(jù),不做征信。所以二者合作得非常好,井水不犯河水,三家征信局把數(shù)據(jù)給到FICO,F(xiàn)ICO收取模型費(fèi)用跑數(shù)據(jù),再把結(jié)果返還給三大征信局,三大征信局來面對(duì)整個(gè)市場(chǎng)。
但是在中國,企業(yè)都希望能貫穿前后端,任何一家征信公司都想把數(shù)據(jù)源也做了,做數(shù)據(jù)源的公司也希望能向上做征信。
所以在中國不可能有只做數(shù)據(jù)或征信的情況,一定會(huì)變成一個(gè)大型的托拉斯。
我認(rèn)為中國首先會(huì)在各個(gè)場(chǎng)景中出現(xiàn)征信公司,比如擁有快遞的順豐能做一家征信公司,電商的京東、阿里各做一家,也許社交的騰訊一家。不過它們向其他領(lǐng)域擴(kuò)展會(huì)很困難,數(shù)據(jù)互通也有難度。
我們相信在這些場(chǎng)景征信之上一定會(huì)誕生五到八家跨場(chǎng)景、透明中立的第三方征信機(jī)構(gòu)存在。冰鑒的目標(biāo)就是成為其中一家。
對(duì)中美互聯(lián)網(wǎng)金融和機(jī)器學(xué)習(xí)有深入理解的同時(shí),顧凌云還曾是全國首屆大專辯論賽全國唯一最佳辯手,他在人文歷史哲學(xué)方面有很深的積累,冰鑒的命名就是一例。峰瑞資本期待與這種對(duì)行業(yè)有深入了解,同時(shí)有良好視野和廣大格局的創(chuàng)業(yè)者合作?!w治遠(yuǎn)
文章內(nèi)容轉(zhuǎn)載自峰瑞資本
版權(quán)及免責(zé)聲明:凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章,不代表本網(wǎng)觀點(diǎn)和立場(chǎng)。版權(quán)事宜請(qǐng)聯(lián)系:010-65363056。
延伸閱讀
版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號(hào)-2京公網(wǎng)安備11010502003583