大数据平台跑马圈地:迅速扩张以引领行业标准

  7月上旬,在武汉的一个大数据企业总裁沙龙上,参会企业负责人每人拿到一张调查问卷,内容包括如何定义大数据企业标准,以及发展大数据产业的建议。

  参与的企业包括电子信息服务企业、传统企业的信息服务公司,还包括智能马桶盖、无人机制造企业等等,21世纪经济报道记者现场采访多家企业,大多数企业负责人表示,目前对大数据企业的定义比较模糊。

  关于大数据的定义,业界尚未有统一说法。按照工业和信息化部电信研究院的定义,目前大数据产业生态中,主要包括大数据解决方案提供商、大数据处理服务提供商和数据资源提供商,分别向大数据的应用者提供大数据服务、解决方案和数据资源。

  “大数据领域,各个环节的企业互相依存,而不是传统产业的单向依存。所以叫生态链,而不是产业链。”齐红威表示。在大数据行业内,市场主体的供求关系比较复杂,数据的供给方往往也是需求方,难以形成具有简单上下游关系的简单产业链条。

  同时他特别提到,行业规则的缺失,是当下大数据产业发展的最主要瓶颈之一。大数据企业对规则和标准的渴望可见一斑。

  21世纪经济报道记者采访发现,不少先行的企业,已经在尝试制定包括数据权属、估价标准在内的行业标准。不止一位企业人士表达了“希望迅速扩张发展,并引导或引领数据交易行业标准”的野心。

  由北京数海科技有限公司牵头,于2014年2月20日发起建立的中关村数海大数据交易平台,是国内首个面向大数据交易的产业组织。在该平台官网的法律法规页面下,21世纪经济报道记者只发现了该平台从去年6月起开始实施的《中关村数海大数据交易平台规则》,“本规则是由中关村大数据交易产业联盟指导,联合工信部电信研究院等科研机构,共同制定的关于平台相关交易活动的指导性文件。”

  在贵阳,大数据从业者们也在做着相似的工作。2015年5月26日,贵阳交易所在贵阳举行的数博会上发布了《贵阳大数据交易所702公约》。公约总则里写道,“……该公约由贵阳大数据交易所聚合了相关大数据企业、行业协会、投资机构、科研院所、政府部门等共同制定,希望通过该公约推动制定与推行大数据交易标准、交易安全、监管监察等规则,从而推进大数据交易的发展……”

  王叁寿表示,贵阳大数据交易所是全国首个大数据交易所,未来中国应该只有一个统一的交易所。“天下武功,唯快不破。”他再次向记者强调了他的观点,贵阳已抢占先机。

  企业方面,除了数据堂、数海、贵阳大数据交易所,还有亿赞普科技集团公司也正在构筑“世界级互联网大数据平台”。

  国内已有多地政府正在筹备大数据交易平台,今年7月武汉集中揭牌了长江大数据交易所(筹)和东湖大数据交易中心;江苏方面称,江苏省大数据交易中心也即将获批;重庆正在打造重庆大数据跨境电子商务平台。

  与企业不同,研究界对大数据产业规则的制定则抱有更谨慎的态度。一位参与大数据产业“十三五”规划制定的专家向21世纪经济报道记者表示,大数据交易平台作为大数据交易的第三方,在交易过程中应该起到制定规则和标准的作用,具体职责主要是撮合交易和数据审查,对于数据内容本身不应该有更多的干预和参与。

  他还表示,也不能完全反对将大数据交易平台交给行内人士操作,“把这样一个新兴事物交给政府或第三方都很难成功,但这需要制定更明确的职责界定,平台只能有平台的功能。”

  大数据权属和安全:不触碰和销售个人数据为底线

  在业内人士看来,目前影响大数据交易和商业化的瓶颈是,大数据的产权界定、交易规则以及一些法律规范等。国务院发展研究中心技术经济研究部副部长田杰棠表示,大数据产权的界定是大数据交易和商业化的前提。

  从国家层面密集出台的政策,到“十三五”规划的编制,围绕这个行业的规范正在建立。参与规划制定的专家和企业均对21世纪经济报道记者表示,即使在“十三五”规划完整出台后,大数据产业行业标准和相关的法律规范也很难在短时间内完成,特别是在立法上。

  参与规划编制会议的王叁寿透露,由于大数据产业需要与其他行业紧密结合的特性,不同行业的大数据应用需要的标准都有不同。工信部编制规划,首次提出了将大数据产业分为金融大数据、能源大数据、医疗大数据等三十多个分支行业,并将针对不同行业分别进行大数据资源开放共享、大数据交易、大数据安全、大数据标准、大数据行业应用等方面的产业规划与课题研究。

  在调查中21世纪经济报道记者逐渐发现,如果说制定完善的行业规则体系是大数据产业发展所必需的外部条件,在大数据产业内部,还存在一个内生的、亟待解决的博弈焦点——数据产权的相关问题,特别是在政务数据方面。

  按照获取方式的不同,大数据可以分为线上数据和线下数据。在线下数据中,政府所掌握的大量政务数据由于涉及个人隐私和国家安全,其使用和权属一直是大数据行业关注的焦点。

  长期研究大数据的田杰棠告诉21世纪经济报道记者,其实数据交易很早就存在,只是以前需求没有现在这么大,也没有公共的交易平台,很多交易处于灰色地带。

  目前国内已有不少个人信息被买卖的案例。比如,报考公务员考试后,就开始收到考试培训推销电话;订车后就开始收到车险推销电话。据媒体报道,这类数据交易,通常属于黑市交易,依据详细程度、时间、地区等被赋予不同的价位。

  当下国内已经出现一批大数据交易平台和数据服务公司,但是围绕数据获取与收集的红线在哪里,数据的权属是谁,如何获取数据,尤其是涉及大量个人隐私的政府政务数据,仍存诸多灰色地带。

  21世纪经济报道记者采访多家大数据企业,其对数据获取,特别是非公开的政务数据方面,获取手段各显神通;在规避数据权属问题、个人隐私和信息安全方面,也有各自的规避办法。

  以数据堂为例,在获取数据上,齐红威强调目前其核心优势是获取线下数据,他们利用一款众包平台APP,让40余万兼职众客来完成,比如人脸图像、购物小票、语音等;另一种方式则是采购;对于政务数据则是采取与政府合作的形式。

  在数据权属方面,数据堂一再强调自身的“数据银行”身份。所谓数据银行,就是在经营数据堂的交易平台过程中,一方面吸收“存款”,获得产权仍属于数据生产者的原始数据;一方面发放“贷款”,将整理后的标准化数据提供给数据的需求方。

  数据银行通过将零散的数据整合成为有价值的标准化数据,实现数据使用权的转移,从而避免触碰数据的拥有权和产权问题。除开数据平台,在数据堂自身的数据定制业务中,其数据获取方式也在尽量回避产权的问题。

  比如,帮助互联网金融企业建立个人征信体系是数据堂的重要业务之一,在相关敏感数据的获取上,数据堂采用的模式是将数据清洗程序直接在政府部门的机房和场地进行,经由政府部门检查后将数据分析结果带出,这同样是在回避接触和拥有底层数据。

  王叁寿的判断则更加乐观。他认为,随着数据价值的不断释放,数据将会是政府手中的新资产,是可以与土地资源并称的具有无限循环性的资源。而贵阳大数据交易所要做的,就是推动政府数据的资产化。目前,已经有十余个地方政府在贵阳交易所开了账号,其中广东省已经参与了实质性数据交易。

  21世纪经济报道记者采访发现,大数据企业规避风险,都有一条约定俗成的底线,“不触碰和销售底层数据”,即不会涉及单个人的具体数据,除非获得个人授权。