今年以來(lái),根據(jù)中國(guó)信息通信研究院《中國(guó)大數(shù)據(jù)發(fā)展調(diào)查報(bào)告2018》數(shù)據(jù)顯示,2017年我國(guó)大數(shù)據(jù)市場(chǎng)規(guī)模為236億元(該統(tǒng)計(jì)口徑是大數(shù)據(jù)核心產(chǎn)業(yè),包括大數(shù)據(jù)軟件、硬件和服務(wù)的直接產(chǎn)值,不包括附加值)。而同年,我國(guó)小龍蝦產(chǎn)業(yè)連年快速增長(zhǎng),市場(chǎng)規(guī)模超千億元。為何,作為信息時(shí)代核心資源、未來(lái)戰(zhàn)略高地的大數(shù)據(jù)產(chǎn)業(yè),在經(jīng)歷幾年的資本流入和產(chǎn)業(yè)發(fā)展之后,市場(chǎng)規(guī)模到頭來(lái)還遠(yuǎn)比不上如此接地氣的小龍蝦產(chǎn)業(yè)?
Hype曲線透析大數(shù)據(jù)發(fā)展路線
為了客觀看待這個(gè)問(wèn)題,我們需要認(rèn)識(shí)、了解新興技術(shù)發(fā)展的Hype曲線。這是由Garnter公司公布的技術(shù)成熟度曲線,描述的是新技術(shù)、新概念在媒體上曝光度隨時(shí)間的變化。圖1是2016年Gartner公布的Hype曲線。任何新技術(shù)的出現(xiàn),都會(huì)經(jīng)歷五大周期:一是炒作期;二是隨著資本媒體的關(guān)注,達(dá)到一個(gè)期望峰值;三是新技術(shù)會(huì)遇到各種各樣的現(xiàn)實(shí)問(wèn)題,往往現(xiàn)實(shí)不如期望般美好,因此會(huì)有一個(gè)泡沫破滅的下滑期;四是產(chǎn)業(yè)開(kāi)始腳踏實(shí)地解決一個(gè)個(gè)實(shí)際問(wèn)題,慢慢推動(dòng)新技術(shù)的應(yīng)用和發(fā)展,從而進(jìn)入穩(wěn)步爬升期;五是隨著關(guān)鍵短板的解決,技術(shù)會(huì)進(jìn)入實(shí)質(zhì)性的規(guī)模商用期,真正實(shí)現(xiàn)其價(jià)值。
圖1 Gartner Hype曲線
如圖1藍(lán)色方框是大數(shù)據(jù),經(jīng)過(guò)前兩年的炒作,大數(shù)據(jù)產(chǎn)業(yè)開(kāi)始發(fā)現(xiàn)并面臨一個(gè)個(gè)現(xiàn)實(shí)問(wèn)題,只有解決了這些問(wèn)題,才能真正推動(dòng)大數(shù)據(jù)產(chǎn)業(yè)進(jìn)步。值得注意的是,這個(gè)Hype曲線是Gartner2016年公布的,2017年Hype曲線并沒(méi)有大數(shù)據(jù)產(chǎn)業(yè),因?yàn)镚artner覺(jué)得大數(shù)據(jù)并非是新興技術(shù)。因此現(xiàn)在2018年,大數(shù)據(jù)產(chǎn)業(yè)的實(shí)際位置應(yīng)該相比上圖再稍微下移一些。
需突破3個(gè)發(fā)展瓶頸
問(wèn)題來(lái)了,既然大數(shù)據(jù)產(chǎn)業(yè),現(xiàn)在面臨不那么美好的泡沫破滅期,那么未來(lái)我們究竟要解決哪些瓶頸和桎梏,才能推動(dòng)其真正步入穩(wěn)步爬升期,體現(xiàn)出應(yīng)有的價(jià)值?筆者認(rèn)為主要有以下3個(gè)方面的問(wèn)題亟待解決。
第一要解決“不會(huì)”的問(wèn)題。大數(shù)據(jù)如果要作為產(chǎn)品和服務(wù)變現(xiàn),那么首先需要建立起數(shù)據(jù)資產(chǎn)的概念,把企業(yè)積累的數(shù)據(jù)當(dāng)做資產(chǎn)去經(jīng)營(yíng)。“不會(huì)”用數(shù)據(jù)分為3個(gè)層次。第一個(gè)層次是壓根沒(méi)有建立起數(shù)據(jù)資產(chǎn)概念的問(wèn)題。目前我國(guó)三大產(chǎn)業(yè)90多個(gè)行業(yè)中,除了少數(shù)行業(yè)如金融、電信、互聯(lián)網(wǎng)等行業(yè)的大數(shù)據(jù)探索起步較早之外,絕大部分行業(yè)對(duì)大數(shù)據(jù)技術(shù)認(rèn)識(shí)不足,到底什么是大數(shù)據(jù)?該采集哪些數(shù)據(jù)?采集之后怎么用,能帶來(lái)什么效益?絕大部分行業(yè)在這一層次的認(rèn)識(shí)較為匱乏。第二個(gè)層次是有了大數(shù)據(jù)的意識(shí),但是存在數(shù)據(jù)整合的問(wèn)題。由于一個(gè)企業(yè)內(nèi)部分為很多事業(yè)部,每個(gè)事業(yè)部又有多條生產(chǎn)線,除了生產(chǎn)數(shù)據(jù),還有管理系統(tǒng)數(shù)據(jù)、營(yíng)銷數(shù)據(jù)、維修數(shù)據(jù)、客戶數(shù)據(jù)等。多種內(nèi)部的數(shù)據(jù)互相割裂,難以融合使用。第三個(gè)層次是數(shù)據(jù)實(shí)現(xiàn)了初步整合,但是沒(méi)有統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)質(zhì)量難以管控的問(wèn)題。同樣的數(shù)據(jù),在不同線條、不同事業(yè)部、不同部門間有不同的表征方式,對(duì)于主數(shù)據(jù)、元數(shù)據(jù)的管理極不規(guī)范,導(dǎo)致雖然能初步形成數(shù)據(jù)礦產(chǎn),但是卻是鐵礦、銅礦,價(jià)值不高。
一言蔽之,“不會(huì)”是數(shù)據(jù)源企業(yè)內(nèi)部的問(wèn)題,要解決這個(gè)問(wèn)題,亟待建立數(shù)據(jù)資產(chǎn)的概念,用科學(xué)的數(shù)據(jù)資產(chǎn)、科學(xué)的管理方法,把數(shù)據(jù)源形成可用的狀態(tài)。
第二要解決“不敢”的問(wèn)題。解決了數(shù)據(jù)源的原材料問(wèn)題,接下來(lái)是數(shù)據(jù)流通的問(wèn)題。根據(jù)《中國(guó)大數(shù)據(jù)發(fā)展調(diào)查報(bào)告2018》,企業(yè)運(yùn)用大數(shù)據(jù)最多的領(lǐng)域,仍然是營(yíng)銷分析、客戶分析和內(nèi)部運(yùn)營(yíng)管理三大塊(如圖2)。這3塊仍然是偏向內(nèi)部應(yīng)用。而企業(yè)使用的大數(shù)據(jù)的來(lái)源,主要是來(lái)自自身生產(chǎn)數(shù)據(jù)、用戶數(shù)據(jù)、內(nèi)部經(jīng)營(yíng)管理數(shù)據(jù),使用的外部數(shù)據(jù)占比較小,整個(gè)大數(shù)據(jù)仍然處于“男耕女織”的相對(duì)封閉時(shí)代,其最根本的阻礙是數(shù)據(jù)的安全合規(guī)流通(如圖3)。雖然我國(guó)已出臺(tái)了大數(shù)據(jù)相關(guān)法律法規(guī),但仍然存在很多空白地帶,即灰色地帶。在這些灰色地帶,很多企業(yè)開(kāi)始了嘗試,但是這些嘗試到底是合法還是非法,目前沒(méi)有定論。
圖2 企業(yè)大數(shù)據(jù)應(yīng)用場(chǎng)景
圖3 企業(yè)使用數(shù)據(jù)來(lái)源
數(shù)據(jù)流通我國(guó)存在兩極分化的現(xiàn)象。一方面,數(shù)據(jù)流通的“汽化狀態(tài)”,即數(shù)據(jù)如空氣般快速流通。但這樣勢(shì)必會(huì)忽視掉一些數(shù)據(jù)安全問(wèn)題、數(shù)據(jù)泄漏問(wèn)題、數(shù)據(jù)權(quán)屬問(wèn)題。例如前段時(shí)間山東的“30億條”,就是有不法公司非法獲取運(yùn)營(yíng)商數(shù)據(jù)開(kāi)展?fàn)I銷、加粉等牟利。另一方面,是數(shù)據(jù)流通的“固化”狀態(tài),即數(shù)據(jù)根本不流通。我們也同樣看到,一些手握優(yōu)質(zhì)數(shù)據(jù)資源大型企業(yè),為了規(guī)避風(fēng)險(xiǎn),一刀切、不流通,這樣也同樣不適應(yīng)行業(yè)的發(fā)展。
為了解決這些問(wèn)題,不能一味訴求于法律,因?yàn)榉刹豢赡苌婕暗街T多場(chǎng)景細(xì)節(jié);不能一味訴求于政府,因?yàn)樾姓Y源是稀缺的,不可能兼顧方方面面。最靠譜的方法就是行業(yè)推動(dòng)來(lái)解決,通過(guò)先選取某些場(chǎng)景進(jìn)行試點(diǎn),再推廣開(kāi)來(lái),大家通過(guò)標(biāo)準(zhǔn)形成共識(shí),一步一步解決這個(gè)世紀(jì)難題。
第三要解決“不清”的問(wèn)題。前兩個(gè)問(wèn)題中,第一個(gè)是數(shù)據(jù)源自身的問(wèn)題,第二個(gè)是流通中的問(wèn)題,那么第三個(gè)問(wèn)題便是與數(shù)據(jù)使用方相關(guān)的問(wèn)題。目前,存在著很多“不清”:權(quán)屬不清、估值不清、存證不清等。大數(shù)據(jù)與普通商品和服務(wù)不一樣,A方賣給B方后,A方的使命就結(jié)束了,而大數(shù)據(jù)不是,大數(shù)據(jù)在經(jīng)過(guò)層層流轉(zhuǎn)之后,還保留著最初的印記,而A方與B方還有諸多“不清”需要解決。
首先是估值不清。當(dāng)前在我國(guó)大數(shù)據(jù)產(chǎn)業(yè),整體的商業(yè)模式大致可以分為3種,賣資源的、賣工具平臺(tái)的、賣解決方案的(此處暫不討論提供基礎(chǔ)設(shè)施的)。對(duì)于后兩種,有明確的商業(yè)模式和市場(chǎng)已有的參考??墒菍?duì)于賣數(shù)據(jù)資源的,類似于一種無(wú)形資產(chǎn),尚沒(méi)有統(tǒng)一、達(dá)成共識(shí)的價(jià)值評(píng)估方法。這樣就會(huì)形成不同的定價(jià)方式,高低價(jià)不均衡。
其次是權(quán)屬不清。用戶的個(gè)人數(shù)據(jù),經(jīng)過(guò)服務(wù)廠商采集、處理之后,權(quán)屬到底屬于誰(shuí)?A方的數(shù)據(jù)流轉(zhuǎn)到B方后,數(shù)據(jù)是屬于A還是屬于B?A方的數(shù)據(jù)通過(guò)B方加工之后,A方是否還對(duì)數(shù)據(jù)擁有主權(quán)?這些都是亟待解決的問(wèn)題。今年8月份,杭州互聯(lián)網(wǎng)法院宣判了我國(guó)首例大數(shù)據(jù)產(chǎn)品不正當(dāng)競(jìng)爭(zhēng)案,在這個(gè)案件中,由淘寶在收集巨量原始數(shù)據(jù)基礎(chǔ)上,以特定的算法深度分析過(guò)濾、提煉整合并經(jīng)匿名化脫敏處理后形成的數(shù)據(jù)產(chǎn)品,其權(quán)屬是被肯定的,也給后續(xù)大數(shù)據(jù)相關(guān)糾紛提供了法律依據(jù)。
最后是存證不清。在大數(shù)據(jù)交易中,尤其是數(shù)據(jù)的多級(jí)交易中,數(shù)據(jù)授權(quán)、數(shù)據(jù)交易記錄等極為重要,這些能對(duì)數(shù)據(jù)濫用、數(shù)據(jù)泄露產(chǎn)生約束,從而規(guī)范整個(gè)行業(yè)的行為。目前行業(yè)中已經(jīng)出現(xiàn)了一些授權(quán)篡改、造假、偽造的情況,這會(huì)導(dǎo)致用戶信息的泄露。針對(duì)這個(gè)問(wèn)題,行業(yè)已經(jīng)出現(xiàn)用區(qū)塊鏈的方式,進(jìn)行大數(shù)據(jù)的存證記錄,后續(xù)有待進(jìn)一步落地深化。
盡管如此,但我們相信,在大數(shù)據(jù)這幾年“緊日子”的前途仍是光明的。當(dāng)產(chǎn)業(yè)齊心協(xié)力,共同推動(dòng)上述難點(diǎn)一步步解決,大數(shù)據(jù)應(yīng)有的價(jià)值便會(huì)充分釋放,熠熠生輝。