当前位置:首页 > 新闻中心 > 媒体报道

南方都市报|政府数据开放准备度之企业应用篇

时间 : 2019-03-18 11:19:59 来源 : 南方都市报 【字体:

  开放数据创新应用大赛参赛团队的苦恼:

  政府与开发者协同不足 制约数据应用落地

  政府数据的价值在于通过开发利用,实现科学决策、精准治理、公共服务优化以及数据资源产业化。然而一直以来,在政府数据的开发与使用上,政府与开发者较难实现场景共享、协同共治,一方面是政府管理者无法掌握用户需求,另一方面是企业或应用开发者不知道政府需要解决哪些问题。本期“政府数据开放准备度”以“数据应用”为视角,对开放数据创新应用大赛参赛团队展开调研,看看他们的实践路径。

  多地试水创新竞赛推进数据应用

  目前,我国政府数据的开放应用多以政府主导为主,即通过政府主动开放自身数据并吸引企业投资(资金、技术)的方式,来深化政府数据的创新应用,主要方式包括开展创新应用竞赛、政企合作建立试点项目等。

  上海、重庆、贵州等省市区近几年纷纷试水政府数据创新大赛,SODA、CODA等崭露头角。由上海市经信委举办的开放数据创新应用(SODA)大赛始于2015年,以“数据众筹、应用众创、问题众治”为模式,每年围绕不同主题,均以开放数据为基础,面向全社会征集数据应用案例,迄今已举办四届,先后吸引国内外1600多支团队、超万名选手参赛。

  原本在规划院系统工作的刘浏2016年带领团队参加SODA大赛,获奖作品“StreeT alk”是一个依托城市街道影像进行的城市慢行环境评估平台,基于街道整治数据、街景照片数据库实现城市步行指数地图。

  主要研究运营管理的上海对外经贸大学管理学院副教授陈瑶2016年带领团队首次参赛,基于1亿多条上海一卡通乘客刷卡数据,研发地铁在站人数、人群密度、人群智能疏散路线优化等算法,给上海地铁做了一次“体检”,诊断哪条线路最为拥堵,团队最后呈现成果还包括上线微信小程序“优行地铁”,并摘得“优秀奖”;2017年陈瑶团队再次参赛,聚焦分析消费者投诉数据,旨在帮助上海工商举报投诉系统进行智能升级;2018年,陈瑶团队依靠“数游长三角旅游大数据平台”项目第三次摘得SODA大赛优胜奖。

  来自上海大学上海美术学院信息与交互设计工作室李谦升团队针对上海市政府数据服务网站中所发布的公共数据,设计制作“DataSH上海公共数据可视化门户网站”平台,2016至2018年期间,在城市交通、绿化、文化、污染等公共数据领域推出一系列可视化作品。

  数据更新数据质量制约应用落地

  赛后,这三个参赛团队和他们的数据应用产品有了不同的走向。

  李谦升介绍,他们以推广公共数据为主,利用数据可视化的直观方式帮助建立公众与公共数据之间的沟通渠道,通过空间、趋势、故事和工具四个维度上的核心功能,让市民了解从数据视角来观察所生活城市的方式,为提升城市管理水平打开畅通的信息通道。

  而刘浏团队开发的“StreeT alk”获得了全新的业务合作,团队成立公司开始创业,一方面延续SODA项目概念做独立的产品研发,另一方面更多的是为城市规划相关行业提供数据咨询服务。

  陈瑶团队是赛后在主办方的牵线搭桥下,通过“高校+企业”身份与上海多个政府主管部门开展合作,延续了SODA项目。比如,基于实际业务需求,陈瑶团队对上海工商举报投诉系统进行智能化、大数据升级,并逐步开发功能模块,以进一步降低人工管理的压力,达到精准监管的目的。同时,结合大量外部数据,让政府部门更加主动监测市场热点,防范风险。

  SODA联合发起人高丰在讲述SODA参赛获奖项目的延续时表示,赛事过程中大多数团队都会针对政府开放的样本数据去做一系列数据挖掘、分析和可视化,帮助数据提供单位更好理解自身业务,助力问题解决。从项目的创意到实施,需要打通数据资源,连接数据拥有方、业务需求方、数据创新方来共同推动完成。

  也正是因为数据应用与政府数据开放仍然存在协同不足等问题,不少项目难以推广,市场化落地困难。李谦升团队谈及其项目推进的最大问题可能还是定位:“我们目前还是以公益项目的方式来定位,最终目的是以推广公共数据为主,它不像一些很具体的应用,可以很清晰地看到如何把数据变成有价值的资源。”

  即便是有成功经验的陈瑶也提到,纯研究驱动的开放数据应用有较大的落地困难,开放数据不能及时更新,应用缺乏及时性;与实际主管部门合作机会较少,难以发挥社会价值,“例如我们的‘优行地铁’项目由于乘客刷卡数据只开放用于比赛,后期数据未能及时更新,未能找到成熟商业模式”。

  陈瑶认为目前政府数据应用,应该以政府采购服务的方式来持续,“目前比较推崇的是政府主导的数据工作室模式,建立项目制。政府提出需求,拿出一部分数据由专门研发团队去做集中的应用开发。但最后如何落地,在什么平台上使用,还需要政府部门来协调”。去年,陈瑶的“数游北极星”团队加入上海房屋土地资源信息中心数据工作室,借助大数据研究团队进行趋势和问题分析,解决上海郊野公园的规划和运营问题。

  同时,三支团队都认为政府数据质量是制约其开发利用的原因之一,“数据开放不等于数据高质量”。针对数据质量,有学者提出“脏数据”概念,指的是那些不符合要求或标准规范的质量差的数据,如数据缺失、数据错误、乱码等。陈瑶认为,不管是政府开放数据,还是政府内部数据、企业数据,都有数据质量问题,在数据录入、采集过程中不可避免会出错。如果出错以后,没有人、没有专门的标准去研究、去监测,数据就保存在那里,后面做的研究分析就可能遇到各种问题。

  代表建议政府数据应“授权运营”

  除了数据创新应用竞赛,政企合作也是一条有效路径。复旦大学数字与移动治理实验室主任、国际关系与公共事务学院副教授郑磊认为,政府对数据价值的挖掘能力、创新力度不如市场,应把数据开放给社会,让社会来挖掘价值。“他们会跟根据自己企业、产品以及服务特点、服务的用户需求来利用。关键是政府把要原材料开放给别人去加工,要开放出去。”

  今年全国两会期间,全国人大代表、浪潮集团董事长孙丕恕提出“授权运营”路径。他认为,数据既然是有价值的资产,就要把它运营好。如果仅仅是数据“托管”,只能算履行“保姆”的职责;想要晋升为“管家”,还需要很多政府数据授权运营的实践案例,要求政府从数据的开放阶段过渡到授权运营阶段。

  在其看来,政府部门不开放数据主要受制于流程、法规等因素,有两方面疑虑:一是数据安全。管理好数据安全风险就要求数据运营者明确数据使用目的,明确商业底线,做到数据“可用不可见”;二是资质认证。政府应授权什么企业做数据运营?建议应对数据运营者做认证,建立一套认证标准。

  孙丕恕建议从授权局部数据开始,“政府可以按照每阶段开放哪些数据做个条例,最后统一形成黑白名单”。然后再解决怎么授权的问题,“积累实践经验非常重要,要用有限的数据,产生很多的经验”。

  全国政协委员、搜狗公司CEO王小川也提出了对政府数据的需求,递交了《开放公共数据,用人工智能惠民生》提案。王小川认为,可用于人工智能训练的公共数据处于匮乏状态,建议在保障国家安全、公民隐私的前提下,优先推动医疗、教育、养老、法律等民生迫切领域数据深度开放,并针对这些领域数据的开放全面性、时效性、规范性做出明确规定。同时,开展人工智能民生应用试点,与业界探索数据开放合作,有序开放优质公共数据资源,释放公共数据红利。

  课题说明

  “政府数据开放”对提高政府透明度及效率,创新驱动经济发展的价值毋庸置疑,今年全国两会已有多位代表委员为此建言献策。为观察研判现状,南都大数据研究院聚焦“政府数据开放准备度”,从政策保障、社会认知、学术理论、人才储备、企业应用等围绕政府数据开放的“基础条件”出发展开系列数据调研报道,探讨准备度如何?改进空间在哪?助力各地政府数据开放向纵深发展。首期以31省份170份政策文件为样本观察政府数据开放政策保障;第二期分析1053篇文献探讨学术理论热点以及未来研究方向;第三期采访16所高校相关学院的院长老师分析数据人才培养情况;第四期通过对广东8所高校数据科学与大数据技术专业学生定向问卷调查,探究他们对政府数据的认知与应用实践。