随着北京国(guó)际大数据(jù)交易(yì)所(以下(xià)简(jiǎn)称“北数(shù)所(suǒ)”)的发起(qǐ)成立,近年来(lái)不温不火的大数据交易所重(chóng)回舆论场中心。根据官方消息,北数所将以培育数据(jù)交易市场(chǎng)、释放数据要(yào)素价值为核心,打造立足京津冀,辐射(shè)带动全(quán)国,面(miàn)向全球提供(gòng)服务(wù)的金融科技基础设施(shī)。
2015年起,受互联网(wǎng)金(jīn)融和(hé)数字经济爆发(fā)驱动(dòng),多(duō)省市出现过几轮(lún)数据交(jiāo)易(yì)平台兴(xìng)建(jiàn)热(rè)潮。但相比市场(chǎng)化大(dà)数据(jù)公司的(de)野蛮生长,由政府背书(shū)甚至(zhì)主导的大数据交易所模式(shì)却颇为消沉。截(jié)至(zhì)今年4月,国内已(yǐ)公布(bù)的(含筹建)的大数据交易所(中心)已超过30个,但业(yè)务活跃的(de)寥(liáo)寥无几(jǐ)。
这其中,既有顶层设(shè)计、法律法规的缺位,亦有关键技(jì)术未成熟和(hé)体制机制的束缚。
据悉,目前市场最成熟的大数(shù)据应用就在金融信贷记录,而大数据交(jiāo)易(yì)所里,70%以上是带(dài)有金融(róng)属性(xìng)的数据。
在数(shù)据要素化改革的顶层设计驱动下,大数(shù)据交易所再次升温。北(běi)数所的出现代表(biǎo)了一种新的路(lù)径(jìng)探(tàn)索,其技术突破(pò)一定程度(dù)上(shàng)解决了此前(qián)困扰数据流通的最大难(nán)题——数据所有权(quán)争议以及数据的滥用。但这一(yī)商业模(mó)式同样面临重重挑(tiāo)战,能否走通有待时(shí)间的检验。
规范(fàn)金融应用技术(shù)
从2014年成立贵阳大数据(jù)交易所开始,各类大数据交易所(中心(xīn))在国内遍地开花,但在2017年之后开始降(jiàng)温。2018年到2019年(nián),市场一度冻结。
“有立法健全(quán)和司法打击力(lì)度(dù)提升的影响,大数据问题(tí)动辄上(shàng)刑事,合(hé)规(guī)成本高企,各地倾(qīng)向按(àn)兵不动。”一位上海国资大数据公司内部人士向《中国经营(yíng)报》记(jì)者表示,不(bú)过在(zài)他看来,“更(gèng)重要的是业务很难推(tuī)进,根本(běn)上模式就不(bú)成立”。
根(gēn)据中国(guó)信通院发布的《中国数字经济(jì)发展白皮书(shū)(2020年(nián))》,我国大数据的交(jiāo)易模式可大致划(huá)分(fèn)为(wéi)四种:政府(fǔ)牵头或背书的交(jiāo)易所(中心);行业机构为主(zhǔ)的行业数据交易(yì)模式(shì);大(dà)型互联网公司、大型IT厂(chǎng)商为主导(dǎo)的数据交易平台;垂(chuí)直(zhí)数据服(fú)务商(shāng)主导的(de)市场(chǎng)化数据交易模式。这其中(zhōng),后两(liǎng)者主要以盈利(lì)为(wéi)主(zhǔ)要(yào)诉求(qiú),而大数据交易所(中心)因其权(quán)威性(xìng)和合规性最(zuì)强,对(duì)我国数据合规定(dìng)价(jià)与流(liú)通的意义最大。
但(dàn)大数据(jù)交易所模式始终(zhōng)不温不火。2015年(nián)4月,号称全球第(dì)一(yī)家的贵阳(yáng)大数据交易所挂牌(pái)成立(lì),一度引发(fā)关注。根据《贵州(zhōu)日(rì)报(bào)》公(gōng)开信息,截至2018年3月,贵阳大数据交易所会员数量突(tū)破2000家,接入225家优质数据源,交易额累计突破1.2亿元(yuán)。但(dàn)此后,该交易所未再公布过相关(guān)交(jiāo)易数(shù)据(jù)。
一位大数据行业第三方(fāng)技术(shù)公司高管向(xiàng)记(jì)者透露,不少大数据交(jiāo)易所的1.0模式就是把从地方政府、地方国企拿到的数据(jù)放到平台上(shàng),有机构需要交易(yì),就(jiù)开个(gè)API接(jiē)口把数据连上(shàng)。但后来发现,这种(zhǒng)方(fāng)式(shì)下的数据用途(tú)和用量根本不可控(kòng),接入(rù)数据(jù)交易的技术方(fāng)、需求方、中介方等都可(kě)能违规私(sī)下(xià)截留数据(jù),甚至将数据再“卖”给其他相关方。
前(qián)述国资大(dà)数据公司内部人(rén)士(shì)早年(nián)曾(céng)参访华东某市大数据交易中心,现场(chǎng)有(yǒu)人就(jiù)私下向其(qí)表示,如果有(yǒu)数据需求直(zhí)接接(jiē)定向采购就可以,为什么(me)要经过交易中心(xīn),他们能(néng)提供(gòng)什(shí)么价值? 从第三方过一道,数据就会有被截留的可(kě)能。
2020年(nián)11月,由中(zhōng)国人民银行发布的《多(duō)方安全计算金融应用技术规(guī)范》规定了多方安全(quán)计算技术金(jīn)融应用的各种(zhǒng)要求(qiú)。由(yóu)全国金(jīn)融标准(zhǔn)化技(jì)术委(wěi)员(yuán)会(huì)归口管理的《规范》,有助于实现在不泄露原始数据、保障信息安全前(qián)提(tí)下(xià)推动多个主体间(jiān)的数据共享与融合应用。
事实上,随着技(jì)术发展,一些大数据交易所已(yǐ)经(jīng)意识到1.0模式存(cún)在的问题,于是进(jìn)入2.0阶段(duàn)——建云,但还是未能解决(jué)数据(jù)泄露和数据滥用的问题(tí)。“在云上算一(yī)算再把结果(guǒ)给(gěi)需求方,很多需求方仍会担(dān)心:数据、算(suàn)法甚至(zhì)参数(shù)放(fàng)到云上,泄(xiè)露(lù)了怎么办?”前述(shù)技术公司高管表示。
有(yǒu)别(bié)于银联、网联这样的“强牌照(zhào)机构+金融(róng)基础设施”,大数据(jù)交易所(suǒ)可谓(wèi)既无(wú)强牌照,也无强服务,这导致最(zuì)终很多交(jiāo)易(yì)根本不(bú)发生在大(dà)数据交(jiāo)易(yì)所场内,交易所沦为了需(xū)求撮合的(de)中介(jiè)。
事实上,数据确权悬(xuán)而未决导致数据难定价,这也让大(dà)数据交易所的商(shāng)业模(mó)式始终不(bú)清晰。一(yī)位华东(dōng)地(dì)区大数据交(jiāo)易所高管告(gào)诉记者:早期大(dà)数据交易所曾采取按(àn)比例“分佣”模式,但推高了数据交(jiāo)易成本又(yòu)不能提(tí)供(gòng)更有价值的服务。
“我们现在更多采取服务费的模式,比如(rú)有客户需(xū)要对(duì)接一些相关(guān)方数据,我(wǒ)们将双(shuāng)方模(mó)型部署后跑一个脱敏结果出来给到需求方。或者(zhě)是需求方对与某一(yī)方直连数据有顾忌,一般会通过交易所,我们给出一个(gè)多方对接(jiē)的解决方案(àn)。”他(tā)表示(shì)。
上述模式又很像(xiàng)市场化的数据服务商(shāng)。他也承认:在这(zhè)些方面(miàn)交易所和市场化数据机构相比(bǐ)不占优势,“我们一方面做政府数据的开放共(gòng)享(xiǎng),一方面做商业(yè)数据的(de)流(liú)通,但(dàn)优势(shì)肯定还是前者(zhě),这两者对能力的需求不一(yī)样”。
制度(dù)短板(bǎn)
“明文数据(相对于密文(wén)数据的定义)的交易流通在理论上是一(yī)个伪(wěi)命(mìng)题。”华(huá)控清交(jiāo)董事(shì)长(zhǎng)兼CEO张旭东(dōng)向记者表示。因为明文数据一旦被“看(kàn)见”就会暴露信息,就可以被(bèi)无限复(fù)制和传播(bō),就无法控制用途(tú)和用量,就可能被滥用,就无(wú)法厘清“责、权(quán)、利(lì)”。在他看来,这是很多大数据(jù)交易(yì)所无法(fǎ)大规(guī)模推(tuī)进(jìn)数据交易(yì)的(de)根(gēn)本原(yuán)因。
数据(jù)确权问题迄今无解。数据确权(quán),指的是(shì)对数据所有权、使用权、经营权(quán)、知情权、遗忘权、修改权、删除权(quán)等(děng)一系列(liè)权(quán)利的确认。确权是任(rèn)何资源市场化利用的前(qián)提,但在核(hé)心(xīn)的数据所有(yǒu)权上,应该归属企业还是(shì)个人长(zhǎng)期存在争议。在去(qù)年出(chū)台(tái)的《民法典》和《数(shù)据安全法(fǎ)(草(cǎo)案)》中,对此也没有进一(yī)步明确(què)。
早年间(jiān),贵阳大数据交易(yì)所也曾发(fā)布《数据确权(quán)暂行管(guǎn)理办(bàn)法》及《数据交(jiāo)易结算制度》,尝试登记数(shù)据所有(yǒu)权,然后(hòu)对(duì)数据的使用权等进行公开竞价,以(yǐ)实现数据的登记确权及变现。
但前述技术公司(sī)高管指(zhǐ)出:这种“分离”和数(shù)据竞价都是明文(wén)数据(jù),而明(míng)文数据下(xià)面,所有(yǒu)权和使用权是没法真正分离的。隐私计算需要的算力(lì)通常是明文数(shù)据计(jì)算的(de)十倍,很长一段时间这项技术(shù)都没(méi)有(yǒu)投入实(shí)践之中。此外(wài),这(zhè)种竞价(jià)所得(dé)的数据只是一(yī)次性的交易,后续数据的用(yòng)途也(yě)并不(bú)可控(kòng)。
根据北数所(suǒ)成立时官方(fāng)披(pī)露信(xìn)息(xī),其正(zhèng)是通过(guò)多方计算技术实现(xiàn)“数据可(kě)用不可(kě)见,用途可控可计(jì)量”,实质上完(wán)成了数据使用权(quán)和所有权(quán)的分(fèn)离。这也(yě)是(shì)市场定义其为(wéi)“新型”大(dà)数据交易所(suǒ)的重要原因(yīn)。
这项技术来(lái)源于国内多方计算领域头部机构华(huá)控(kòng)清(qīng)交,是北(běi)数所的四(sì)个发起股东(dōng)之(zhī)一。
“面对数据(jù)所有权难题,既可以(yǐ)等(děng)到法律规章明确后再依法合规(guī)地操(cāo)作,也(yě)可(kě)以(yǐ)先摸着石头过(guò)河,从数据的使(shǐ)用权和受益权入手(shǒu)进行探索。”张旭东(dōng)向记者表示(shì)。在他看来,如(rú)果利用技术手段(duàn)把数据“可见”的具(jù)体信息和用不着“看见”就(jiù)可以(yǐ)用于计算(suàn)的使用价值分离(lí),并能够(gòu)对数据使(shǐ)用(yòng)价值(zhí)的(de)具(jù)体用途和使用次数途进行控制,实质上就可以把数(shù)据的使用权(quán)从所有权(quán)中分(fèn)立(lì)出来,为厘清数据(jù)使用(yòng)的“责、权(quán)、利(lì)”提供技(jì)术手段。
张旭东(dōng)认为:交易所(suǒ)流通的应该是数据的特定使用(yòng)权(quán),而(ér)不(bú)是明文数(shù)据本身。“交易(yì)所应该是餐厅(tīng),而不是菜市(shì)场。它(tā)出售的不是数据原材料,而是(shì)特定的计(jì)算结果。数据可用不可见和规定数据(jù)具体(tǐ)用途用量可以使(shǐ)数据的特定使用权成(chéng)为有(yǒu)限(xiàn)的供应和有限制的需求,继而可以通过市场供需进行定价并大规(guī)模地(dì)交易流(liú)通。”
据透露,这(zhè)套底层(céng)交易系统已(yǐ)经跑通(tōng),华控(kòng)清交也(yě)正在建议和(hé)推动数据使用权的(de)地方立法。
技术(shù)突破为(wéi)中国大数据交(jiāo)易所解决确权和定价问题提供了解决思(sī)路,但这一市(shì)场(chǎng)的发展(zhǎn)仍(réng)严重缺乏机制保障。除了立法(fǎ)层面缺失,地方在规划和执行层面仍处于(yú)各自为政、一盘(pán)散沙的局面(miàn)。
前(qián)述大数据交易所高管(guǎn)就表示:目前交易所基本是各省、各部门各(gè)自为政,跨区域(yù)跨系(xì)统很难打通关(guān),很多不同(tóng)单位之间数据格(gé)式、字段内容(róng)不统一,接口不兼容,制度制约不能(néng)让数据价(jià)值有效流动(dòng)。此外很多地(dì)方政府对于数据流(liú)通的(de)看法还非常(cháng)初级,“他们认为数据是自己的、本省的(de),但数据其实是没有(yǒu)地域限制(zhì)的(de),这些都还需(xū)要三到五年的(de)改造过程”。
而创新技术在解决多方问(wèn)题上,也很(hěn)难采取(qǔ)标准化方式。例如北(běi)数所(suǒ)目前采取的(de)是数据分级管理——针对无(wú)条件开放的(de)公共数据,通(tōng)过北(běi)京(jīng)政务数据资源网向社会免费开放(fàng);针对金融(róng)领域数据(jù),采用授权(quán)调用、共同(tóng)建模等方式,开展(zhǎn)协(xié)同应用服务;针对(duì)高价值的多方数据,通过新型数据交易平台,采用(yòng)多方安全计算、联邦学习等技术,支撑(chēng)数据使用权交(jiāo)易。
一(yī)位业内人士(shì)就向记者指出:金融数据为什么没办法通过(guò)新(xīn)型数据(jù)交易平(píng)台交易(yì),也值(zhí)得(dé)思索。