就在今天早上, 复旦大学和提升政府治理能力大数据应用技术国家工程实验室, 联合举办"中国地方政府开放数据指数发布暨交流论坛", 并发布由复旦大学数字与移动治理实验室出品的 《2017中国地方政府数据开放平台报告》~ 在公布的2017 中国开放数林指数中 贵阳排名全国第二! 仅次于上海~ 这项指数在副省级与地级的排名中, 贵阳位列第一! 让我们一起来为贵阳的努力和成果点zan吧! ~恭喜~ 贵阳市政府数据开放平台 喜获树开叶茂●大奖 贵阳市信息产业发展中心高级工程师黄明峰上台领奖, 并发表了"贵阳市政府数据开放的探索和实践"的主题演讲…… 带你认识"贵阳市政府数据开放平台" 接下来, 数据君将为你揭秘这份刚刚发布的 《2017中国地方政府数据开放平台报告》 看完你就知道咱们贵阳在全国到底有多牛! ▼▼▼ 据悉,《中国地方政府数据开放平台报告》将定期发布"开放数林指数",持续追踪我国地方政府数据开放工作的推进与深入,精心测量"数木"们的粗细、密度、材质与价值,助力中国开放数据生态系统的形成与发展。 评估范围 报告根据公开报道,以及使用"数据+开放"、"数据+公开"、 "政务+数据资源"、"政府+数据服务"、"地名+政府数据"、"地名+数据"等关键词进行搜索,发现了截至 2017 年 4 月我国已上线的政府数据开放平台,并将符合以下条件的开放数据平台纳入评估范围: (1)平台域名中出现 gov.cn,作为确定其为政府官方认可的数据开放平台的依据。 (2)平台形式为"统一专有式"或"统一嵌入式"。 (3)平台所代表的地方政府的行政级别一般为地级市以上。 (4)平台上确实开放了电子格式的、可通过下载或接口形式获取的、结构化的数据集。 具体平台名称、所属地方政府和平台域名如下: 1 北京市政务数据资源网 北京市 省级 www.bjdata.gov.cn 2 开放广东数据服务网 广东省 省级 http://www.gddata.gov.cn 3 贵州省政府数据开放平台 贵州省 省级 http://www.gzdata.gov.cn/ 4 上海政府数据服务网 上海市 省级 http://www.datashanghai.gov.cn/ 5 浙江政务服务网 浙江省 省级 http://data.zjzwfw.gov.cn/ 6 广州市政府数据统一开放平台 广东省广州市 副省级 http://www.datagz.gov.cn/ 7 哈尔滨市政府数据开放平台 黑龙江省哈尔滨市 副省级 http://data.harbin.gov.cn 8 青岛市政府数据开放网 山东省青岛市 副省级 http://data.qingdao.gov.cn 9 深圳市政府数据开放平台 广东省深圳市 副省级 http://opendata.sz.gov.cn/ 10 武汉市政府公开数据服务网 湖北省武汉市 副省级 http://www.wuhandata.gov.cn 11 长沙数据开放 湖南省长沙市 地级 http://data.changsha.gov.cn/ 12 数据东莞网 广东省东莞市 地级 http://dataopen.dg.gov.cn/ 13 佛山市数据开放平台 广东省佛山市 地级 http://www.fsdata.gov.cn/ 14 贵阳市政府数据开放平台 贵州省贵阳市 地级 http://www.gyopendata.gov.cn/ 15 梅州市人民政府数据开放平台 广东省梅州市 地级 https://www.meizhou.gov.cn/opendata 16 无锡市政府数据服务网 江苏省无锡市 地级 http://opendata.wuxi.gov.cn/ 17 肇庆市人民政府"用数据"模块 广东省肇庆市 地级 http://www.zhaoqing.gov.cn/sjkf/ 18 湛江市政府数据服务网 广东省湛江市 地级 http://data.zhanjiang.gov.cn/ 19 数说南海网 广东省佛山市南海区 区级 http://data.nanhai.gov.cn/ 报告的主要观察对象为我国地方政府数据开放平台上可通过直接下载或 API 接口两种方式公开获取的、电子形式的原始数据集及其相关信息;不包括平台上的 APP 应用、数据报告、可视化呈现等数据应用产品。基于开放数据的非歧视和公开获取原则,通过内部授权、协议开放等形式开放的数据也不属于本报告的评估对象。 评委专家对评估指标相对重要性排序的结果: 各地政府数据开放平台上线时间: 数据集,是一种由数据所组成的集合,通常以表格形式出现,"列"代表一个特定变量,"行"对应于一个样本单位。政府数据开放平台通常以下载或 API 接口的形式开放数 据集。个别平台上出现的以下三类情况,在报告中将不视作有效的开放数据集: (1)数据集名称下不存在可直接下载或通过接口获取的数据集; (2)数据集中仅有 0 行或 1 行数据(多为将一个数据集分拆出的单行数据,或未整合成一个数据集的单行数据); (3)数据集名称下提供的是网页链接,且链接跳转后出现的是无法通过下载或接口形式获取的文本内容。 放了超过 1000 个有效数据集或接口;其次是青岛,开放了847 个有效数据集。其后,无锡、深圳、北京开放了 400多个的数据集;佛山、东莞、广州、南海、浙江等地开放了 300 多个。 各地平台上开放的数据集数量(包含 API 接口) 为方便用户获取和利用数据,数据集应以可机读格式开放,该格式能被计算机自动读取与处理,如 XLS、CSV、JSON、XML 等格式。 各地平台可下载数据集与可机读格式数据集数量: 开放格式 开放格式是指可下载数据集应以开放的、非专属的格式提供,任何实体不得在格式上排除他人使用数据的权利,以确保数据无需通过某个特定(特别是收费的)应用程序才能 访问。例如 CSV 是开放格式,而 XLS 则不是。 各地平台可下载数据集与开放格式数据集数量: API 接口 除了数据直接下载以外,有些地方平台还提供了应用 程 序 编 程 接 口(API 接 口 ,Application ProgrammingInterface)。与通过直接下载方式获取数据集相比,接口方式使用户可通过参数实时高效地获取所需数据,尤其适用于开发应用程序的需求。深圳、北京、东莞三个地方平台为每个数据集提供了接口。 各地平台数据集总量与 API 接口数量: 开放授权 报告发现,在 19 个政府数据开放平台中,共有 12 个平台配有数据开放授权。7 个平台缺少专门的数据开放授权,占评估总体的 36.8%,这其中有 4 个平台的网站声明与政府门户网站共享,并非专门针对开放数据平台制定,也没有专门涉及数据开放授权的内容。 各地平台开放授权详情: 免费获取 免费获取是指平台在开放授权中明确授予用户免费获取和利用"开放数据"的权利。政府数据作为公共资源,原则上应免费向社会开放,除非需要对数据进行额外的增值加工和针对少数人的个性化加工等。目前各地平台上的相应条款分为"免费且未设时限"、"现阶段免费"、"未明确是否免费"三类。 开放数据免费获取比例: 非歧视性 开放授权是指平台明确授予任何用户平等访问、获取、使用和分享"开放数据"的权利。目前各地平台上的相应条款分为"明确保障非歧视性"、"未明确保障非歧视性"两类情况。 开放数据非歧视性比例: 自由利用 开放授权应明确授予用户不受限制地对"开放数据"进行商业和非商业性利用的权利。目前各地平台上相应条款分为"明确允许自由利用"和"未明确提及可自由利用"两类。 开放数据自由利用比例: 自由传播与分享 开放授权应明确授予用户可自由传播和分享"开放数据"的权利。目前各地平台上的相应条款分为"可自由传播"、"自由传播受限"、"未提及可自由传播"三类情况。 开放数据自由传播与分享比例: 元数据提供 政府数据开放平台为开放数据集提供元数据有助于数据利用者清楚地了解和理解数据集的内容与背景,从而更好地获取和利用数据。 各地平台元数据条目: 基本元数据覆盖率 综合梳理国际开放数据平台上提供的基本元数据条目以及目前我国半数以上的平台已实际提供的元数据条目,报告确定了以下13个条目作为开放数据集基本的元数据条目,包括数据名称、摘要、关键字、数据主题、下载格式、数据提供方、发布日期、更新日期、更新频率、访问量、数据项(字段)、数据量等。其中数据量是指数据集所含的行数(或行数乘以列数),数据项是指数据集中每一列的具体名称,两者有助于利用者更好地了解数据结构与内容。 基本元数据条目在各地平台的分布数: 各地平台基本元数据条目覆盖数: 各地平台基本元数据条目详情列表: 开放各个主题领域的数据集有利于提高数据开放的广度和覆盖面,有利于数据利用者充分获取和融合来自多种领域的数据,进行深度的挖掘利用。2015 年 8 月国务院印发的《促进大数据发展行动纲要》提出要"优先推动信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等民生保障服务相关领域的政府数据集向社会开放"。基于行动纲要的要求,结合国内外开放数据平台上实际开放的重点数据集主题,报告将开放数据主题归纳为财税金融、经贸物流、交通出行、机构团体、文化休闲、医疗卫生、教育科技、社会民生、资源环境、城建住房、公共安全、农业农村、社保就业、信用服务共 14 个大类。 各主题包含的数据集个数: 各地平台主题覆盖数如下: 部门覆盖率 开放数据集的部门覆盖率反映了一个地方政府的各个部门对于数据开放工作的参与程度,也体现了数据集的丰富程度。报告首先梳理了超过半数的地方平台开放数据集所覆盖的部门作为"主要数据提供部门",由于不同地方具有相同职能的部门在名称上存在差异,报告对这些部门的名称做了相应的合并与调整。 各地平台主要数据提供部门数据集数量分布: 统计部门提供的数据多为经过归总加工后的宏观数据,各地还应继续提升各个具体业务部门的开放数据集比例。 数据提供部门占部门总数的覆盖率: 关键词覆盖率 报告对各地平台上数据集名称进行了文本分析,发现了一批出现频次较高的关键词,这些关键词反映了各地开放数据的内容及其分布。 各地开放数据集名称中出现频次最高的 33 个名词: 业"、"机构"、"统计"等。这类词汇仍旧体现了政府部门的用词习惯,而不是社会公众更容易理解的词汇。值得注意的是,作为政府数据开放平台,"数据"一词出现的频次却远小于其它名词,也反映了政府部门的惯性思维。 各地开放数据集名称中出现频次最高的 48 个描述性限定词: 运维政府数据开放平台是一项常态化工作,平台上线后还应持续新增数据集,以不断满足社会对开放数据日益增长的需求。报告根据各地平台上数据集的创建日期来判断该平台数据集是否持续增长,以半年为时段进行跟踪分析,持续增长分值取决于该平台数据集保持持续增长的时段的数量。 各地平台上线时间与数据集持续增长: 动态更新 报告对各地平台开放的数据集所承诺的更新频率进行了分析,分为不更新、不定期更新、每年更新、每半年更新、每季度更新、每月更新、每周更新、每日更新、实时更新九 类。其中,报告将更新频率为不更新、不定期更新、每年或每半年的数据集视为相对静态数据,将更新频率为每季度、每月、每周、每日与实时更新的数据集视为相对动态数据。 数据集承诺更新频率分布: 各地开放数据集承诺的更新频率分布: 实际更新情况 报告从 2017 年 4 月 18 日开始,在之后四周内的四个时间点持续采集数据,采集时间分别为 2017 年 4 月 18 日、2017 年 4 月 24 日、2017 年 4 月 30 日与 2017 年 5 月 7 日,然后通过比对数据集更新时间的变化发现在该时间内实际更新的数据集,未提供数据集更新时间的地方平台未纳入该项评估。 各地平台数据动态更新情况: 多批次保存 多批次保存是指平台将历史上不同时间更新的多个批次的数据留存在平台上,允许用户下载,有利于数据利用者按时间获取和利用历史数据。 实现数据多批次保存的平台分布: 以上种种指数表明: 贵阳市政府数据开放平台起步比较晚, 但发展速度较快。 多项指标在全国处于领先地位! 开放数据,蔚然成林。 一棵棵开放"数木"的丛然并生、成荫如盖、直至叶茂花开, 终将成长为一片繁盛多样、平衡稳定、循环持续的"开放数林"。 |