從數(shù)據(jù)中發(fā)現(xiàn)知識、洞察和規(guī)律,這本身不是一個新概念。幾百年前,在開普勒時代就有這樣的實踐。當(dāng)時,開普勒從幾百頁的天體位置數(shù)據(jù)中,提煉并總結(jié)出了天體運動的三定律,至今仍在被使用,也就是我們熟知的開普勒三定律?,F(xiàn)在,AI幫助我們實現(xiàn)了借助大規(guī)模云計算的方法,從海量的數(shù)據(jù)中自動學(xué)習(xí)知識和規(guī)律。
那么,作為一個數(shù)據(jù)驅(qū)動的AI框架,它可以給我們帶來哪些作用?
首先,數(shù)據(jù)驅(qū)動的AI框架可以帶來個性化的體驗。例如當(dāng)我們進入一些網(wǎng)站,會得到許多個性化體驗。這些體驗讓網(wǎng)站不再是千人一面,通過數(shù)據(jù)驅(qū)動的AI框架可以為每一位訪客做出調(diào)整和優(yōu)化。有效的個性化服務(wù)源自對大量數(shù)據(jù)的深度分析,AI幫助我們精準地將最恰當(dāng)?shù)捏w驗匹配給每位用戶。
其次,數(shù)據(jù)驅(qū)動的AI框架可以帶來細粒度的行業(yè)策略,這些策略可以幫助企業(yè)精細化地運營。例如,一個產(chǎn)品的目標客戶群可以粗略地定義為一定年齡范圍的男性或女性。應(yīng)用了數(shù)據(jù)驅(qū)動的AI框架以后,我們可以得到一個比較詳細的描述,我們不僅可以基于年齡、性別這樣的因素,還可以交叉考慮更多的維度,例如興趣愛好、行為習(xí)慣等,從而得到細粒度的營銷策略。
最后,數(shù)據(jù)驅(qū)動的AI框架可以帶來知識和洞察。我們從經(jīng)驗中可以學(xué)習(xí)到新知識,而數(shù)據(jù)驅(qū)動的AI框架帶給我們的核心價值是,持續(xù)地、運營化地從數(shù)據(jù)中挖掘知識、學(xué)習(xí)知識的能力。這個知識未必是寫在教科書上的,而是從數(shù)據(jù)中實時地、最大體量地同時也是最有效地獲得知識,用于生產(chǎn)和業(yè)務(wù)實踐中。類似地,通過AI可以從數(shù)據(jù)中獲得持續(xù)的洞察。
AI的核心之一是去平均化。例如,對一個公司來說,客戶的平均價值可能是一百元,而去平均化告訴我們,不同客戶對應(yīng)的價值是不同的。這個可以通過AI,從過去客戶的行為數(shù)據(jù)等屬性中學(xué)習(xí)出來,建立自學(xué)習(xí)模型,預(yù)測每個客戶的價值是多少??蛻舻膶嶋H價值,可能與平均值相差很遠。不僅客戶的價值,客戶是否會購買一件商品,喜歡什么樣的商品,以及如何促成一次購買等這些問題,都可以通過AI技術(shù)來幫助回答。去平均化的應(yīng)用不僅局限于營銷領(lǐng)域,還可以應(yīng)用于醫(yī)療和其他商業(yè)領(lǐng)域。例如,在醫(yī)療領(lǐng)域,基于病例來預(yù)測得壞血病的概率和再入院的概率,能夠幫助醫(yī)院挽救病人和降低醫(yī)療成本,這些應(yīng)用已經(jīng)在一些大醫(yī)院里開始實行。
著名的科技思想家凱文·凱利說AI是認知化。如果說電力化帶來了人工的動力,那么認知化帶來了人工的智能。大量的實踐表明,在感知方面,包括AI的視覺、聽覺、語言理解等方面,AI可以接近人腦;在支持專業(yè)決策方面,在海量數(shù)據(jù)的支持下,AI甚至可以超越人腦。
諸如此類的應(yīng)用還有很多,數(shù)據(jù)+AI的核心能力為我們構(gòu)建了一個發(fā)展中的企業(yè)服務(wù)生態(tài),其中包括行業(yè)應(yīng)用,例如金融、醫(yī)療、教育等;另外在每個行業(yè)都有交叉的維度,也就是職能應(yīng)用,例如營銷、客戶關(guān)系管理、安全等相關(guān)職能。行業(yè)應(yīng)用和職能應(yīng)用構(gòu)成二維的矩陣,AI在其中有很多的應(yīng)用場景。
實踐告訴我們,AI大規(guī)模商業(yè)應(yīng)用場景應(yīng)具備兩個必要條件:1.數(shù)據(jù)的質(zhì)量和數(shù)量必須達到一定要求,尤其是整個數(shù)據(jù)流程的打通和定期的數(shù)據(jù)更新,這決定了AI發(fā)展的基礎(chǔ)是否牢固;2.所在領(lǐng)域存在針對問題的清晰定義,如果領(lǐng)域本身沒有明晰的問題定義,則很難通過AI來解決問題。從行業(yè)角度來說,金融已經(jīng)比較接近這兩點;從職能角度來說,營銷、客戶關(guān)系管理、安全等一些數(shù)字化高的行業(yè)比較接近。
作為一個成長中的企業(yè),擁抱AI會面臨一些挑戰(zhàn)。在過去十多年的實踐中,我們發(fā)現(xiàn)了一些具有共性的挑戰(zhàn)。
第一,企業(yè)必須充分理解數(shù)據(jù)的價值。許多企業(yè)都想利用大數(shù)據(jù)推進業(yè)務(wù)發(fā)展,然而數(shù)據(jù)資源就像其他優(yōu)質(zhì)資源一樣,是稀缺的。從一開始,企業(yè)就需要設(shè)計特定的業(yè)務(wù)、產(chǎn)品和技術(shù)架構(gòu),確保持續(xù)的運營可以沉淀下來相關(guān)的數(shù)據(jù)。對于有一定客戶體量的企業(yè)來說,有價值的數(shù)據(jù)可能已經(jīng)在你的數(shù)據(jù)庫里。沒有意識到這點或者不懂得去挖掘數(shù)據(jù)的價值的企業(yè),會錯失利用AI的機會。
第二,發(fā)現(xiàn)和培養(yǎng)AI相關(guān)的人才刻不容緩。眾所周知,數(shù)據(jù)科學(xué)家的稀缺對這個新興的領(lǐng)域有很大影響。在國外,諸如InsightData Science這樣的培訓(xùn)項目,對行業(yè)產(chǎn)生了積極的影響。隨著數(shù)據(jù)科學(xué)家的隊伍日益壯大,在企業(yè)里從事AI的數(shù)據(jù)科學(xué)家也越來越常見。相較之下,我覺得業(yè)界更缺的是AI產(chǎn)品經(jīng)理。在與國內(nèi)外很多公司交流過發(fā)現(xiàn),AI問題的復(fù)雜性之一在于結(jié)果的不確定性,而具備AI背景的產(chǎn)品經(jīng)理非常少,不能夠很好地判斷價值與方向,進而導(dǎo)致相關(guān)產(chǎn)品或項目的擱置。當(dāng)然這里面也有人才培養(yǎng)的問題,例如我們可以嘗試鼓勵優(yōu)秀的數(shù)據(jù)科學(xué)家和工程師去主導(dǎo)相關(guān)產(chǎn)品的開發(fā),在業(yè)務(wù)的指引下,充分發(fā)揮專業(yè)人才的積極性,探索可行的方向。
第三,跨領(lǐng)域團隊的交融與整合是落地的關(guān)鍵。打通數(shù)據(jù)的閉環(huán)后,產(chǎn)品、工程、AI的緊密結(jié)合,往往需要較長時間的磨合。好比在我們構(gòu)建AI平臺的經(jīng)歷中,涉及大量團隊溝通、配合、相互支持的工作。AI能否有效實現(xiàn),工程能力的建設(shè)尤為重要。因為AI不僅是算法問題,如果沒有強大的數(shù)據(jù)處理基礎(chǔ)設(shè)施,那么就很難在大數(shù)據(jù)中進行持續(xù)、大規(guī)模的AI應(yīng)用。基于這樣的需要,純工程師的團隊和純科學(xué)家的團隊,往往都不能最有效地幫助AI落地。只有團隊、業(yè)務(wù)的深度融合才能創(chuàng)造更大的價值。
第四,AI要想為行業(yè)用戶發(fā)揮價值,就必須解決信任問題。AI作為新興的思維方式和技術(shù)體系,在解決行業(yè)實際問題的過程中,一個常見的瓶頸來自于信任的缺乏。這其中的信任就包括了對數(shù)據(jù)和算法的信任。一定范圍內(nèi)的數(shù)據(jù)共享可以增加信任,由此可以帶來全新的知識和洞察。另外,在企業(yè)內(nèi)部的落地場景中,AI的構(gòu)建者和使用方建立信任也至關(guān)重要,這需要在團隊間基于回測或?qū)崪y的效果,進行經(jīng)常性而有效的溝通。
在不同的行業(yè)和職能落地AI,無論是企業(yè)決策者還是執(zhí)行者,都將面臨各種各樣的問題,其中不乏一些具有共性的挑戰(zhàn)。如果解決了這些挑戰(zhàn),我相信不僅大企業(yè),中小企業(yè)也會有比較大的空間來利用AI升級——運用AI領(lǐng)域的最佳實踐,進行快速概念驗證,在風(fēng)險可控的前提下落地生產(chǎn)。
丁磊 |文
丁磊是百度金融首席數(shù)據(jù)科學(xué)家,曾任職匯百川征信CTO、PayPal全球消費者數(shù)據(jù)科學(xué)部負責(zé)人。