首页 > 天池大赛 > 「公益云图 」数据可视化创新大赛
  • 状态 举办方 第 2 赛季截止日期 总奖池 参赛队

    「公益云图 」数据可视化创新大赛

    已结束 2016/09/25 ¥360000 904

    报名参赛

文件名称 (报名后可下载)

文件格式

[0830更新]智慧物流城市末端配送.zip

.zip (515KB)

[更新]青悦环保数据20160629(提取码N7QyIO)

download

[更新]中国气象数据20160629(提取码bIPAu6)

download

中国气象数据(提取码:PJeWlu)

download

上海青悦环保数据(提取码:8SGuYI)

download

本次可视化大赛以环境为主题,希望能够通过对不同数据来源之间的对比、分析,能够从中挖掘出当下环境的问题,各种复杂环境因素之间的影响,再通过可视化的手段以恰当的方式呈现,能够提升公众对环境问题的关注与参与。

参赛选手可以从阿里云数加平台上或是提供参考的网上公开数据源进行竞赛,包括但不限于污染企业档案、企业排污监测、水质监测、空气质量监测、气象监测数据(风、温、降雨等)、交通出行数据。可以围绕如下几个命题进行展开:

复赛鼓励参赛作品多元化,除“公益云图”主题作品外,选手可自选其他主题参赛。公益主题作品可参与所有奖项评选,自选主题作品仅参与专业奖评选。复赛新增可选命题如下:

智慧物流城市末端配送

参赛选手根据官方提供的业务场景描述和数据,以最优的方式展示末端配送2类包裹的配送流。详情请见数据下载链接“智慧物流城市末端配送.zip”(命题文档和数据打包在一个压缩包里)

Timeline

823-96

96 23:59:任务提交截止

激励

·      98日,评选最优作品队伍1, 受邀赴香港科技大学参加“菜鸟final大会”,进行路演分享,同时可获5000元的差旅赞助;

·      930日,评选优秀作品队伍1-2支,直接入围决赛,参与专业奖评选;

 

空气质量与大气环境

所涉及的数据

- 区域内空气质量的实时监测数据,以及监测点的地理坐标

- 当地气象局提供的气压、温度、湿度、降水与风力风向等数据,以及信息采集点的地理坐标

呈现内容

- 空气质量与大气环境的关系  以时间流逝的方式,动态展现区域内空气质量变化。比如在地图图层上,以颜色表示空气质量、以箭头方向和粗细表示风力风向、以观测点位置的动态图标表示温度和湿度等

- 空气污染梯度和区域污染估计  通过曲线拟合,在地图上,绘制类似等高线型的空气污染梯度图,对没有空气质量监测的城市和地区进行空气质量估计

- 风和降水对空气污染的帮助  通常由于风和降水的作用,可以显著改善空气质量。通过关联分析,定量的了解给定风力或降水条件下,空气质量会得到多大程度改善,空气质量改善的速度是什么样的

- 推断空气污染物来源 高级内容 )通过污染物扩散趋势和梯度,推断污染源发生的地理位置,并在地图上标识

- 拟合空气污染与大气环境方程 高级内容 ) 拟合空气污染物扩散的方程,制作交互式的污染物扩散预测,通过用户输入可改变某地的气象状况,然后动态模拟在设定的空气状况下,污染物扩散的趋势、范围和速度

 

空气污染与居民生活

所涉及的数据

- 城市内空气质量的实时监测数据

- 当地气象局提供的气压、温度、湿度与风力数据

- 城市交通出行数据,包括城市道路拥堵状况,用户出行目的地和距离(导航数据)

- 其他反应用户互联网活动的数据,比如微博发帖量、淘宝购物单数、支付宝支付量、等等。

呈现内容

- 空气质量及气象因素对居民出行的影响程度 (可主要关注节假日)。由于居民出行的参考依据通常是人的直观感受,这不但受空气质量影响,还与气压、湿度、温度等相关。空气质量越差出行越少是直觉判断,但这种关系肯定不是线性关系,究竟空气质量差到什么程度会多大程度影响出行,可通过数据进行相关性分析。交通拥堵受各种因素影响,可能不能敏感反应居民出行与否,所以还可以关联其他互联网活动数据,比如爬取微博发帖量,支付宝支付量等等,可以发现居民用户生活变化的情况,与空气质量相关联。是不是空气质量越差,在家上网和网购的人越多?

- 空气质量与居民出行特征的关联分析  空气质量差不一定导致居民不出行,但出行的目的地可能会不同,比如空气质量差的时候,出行到室内活动的可能会显著增加,城市中的大型商圈、商场、体育馆等可能会吸引更多人流。通过用户出行的导航数据,分析居民出行特征随空气质量的变化。

- 空气质量与居民健康的关联分析  如果有医疗就医数据最好,如果没有,可以使用导航数据,看在重度污染的情况下,是否有统计显著的居民就医增加。

 

企业排污与环境水质监测

所涉及的数据

- 区域内排污企业名录,以及企业的地址或地理坐标

- 水质监测系统的监测数据,以及采样点的地理坐标

- 气象降水监测数据

- 区域内,省市级的 GDP 数据 ,制造业指数,进出口数据(国家统计局公开数据)

呈现内容

- 污染企业与水质监测  在地图上,标识出排污企业的地理位置,按时间流逝,动态显示监测点的水质状况。可通过配置,选择显示不同污染物指标。不同污染物可能对应不同的污水排放企业。

- 水污染与降水信息的关系  通过与气象降水信息相关联,了解自然降水是否能稀释河流中的污染物,还是会由于冲刷作用,使得陆地上更多的污染物流入河流中,恶化水污染状况。

- GDP与水质和空气质量的关系  用图表展示过往几年,区域内 GDP 增长趋势与污染物变化趋势的关系,也可展示与空气质量变化的关系。

- 制造业指数、进出口等重要经济指标与污染水平的关系  对制造业集中的地区,发现制造业、进出口等经济指标与水质和空气污染水平的关联关系。

 

参考数据来源

1.本次大赛提供的数据源:

数据可以在天池平台的Maxcompute上获取到全部范围数据,或下载部分csv样例数据进行分析

 

全国县级城市实时天气数据

数据提供:中国天气网

数据说明:实时天气数据取自中国气象局公开发布的国家级2170个地面气象站的观测数据,数据经过保密处理和站点替代处理,全国2517个县级城市

数据字段:观测时间、温度(℃)、相对湿度、降水量(mm)、风向、风力(m/s)

数据范围:2015.1.1-2015.12.31

更新频率:逐小时更新

表名:chinaweather_station_observation 

备注:数据缺失用999999代替

 

全国风场格点实况数据

数据提供:中国天气网

数据说明:风场格点实况数据由中国气象局公开发布的国家级2170个地面气象站的观测数据反演而成,数据经过保密处理,数据精度为1°

数据字段:经度、纬度、风向、风力(m/s)

数据范围:2016.4.1-2016.5.31

更新频率:逐日更新

表名:chinaweather_grid_wind_observation

备注:数据缺失用999999代替

 

全国县级城市站表数据

数据提供:中国天气网

站点范围:2560个全国县级城市

数据字段:县、市、省

表名:chinaweather_city_station

 

国控站点监测实时空气污染数据

数据提供: 上海青悦环保

数据字段: 省份、城市、城市编码 、站点、站点编码、污染级别、污染等级、首要污染物、AQI、SO2、SO2 24小时均值、NO2、NO2 24小时均值 、CO、CO 24小时均值、O3、O3日最大一小时均值、O3 8小时滑动平均值、O3 8小时最大值 、PM10、PM10 24小时均值、PM2.5、PM2.5 24小时均值、发布时间

数据范围: 山东、江苏2015年全年国控空气站点监测数据,全国2016年1月-3月空气站点监测数据

示例数据 :江阴部分空气站点监测数据.csv

表名: tc_air_station_realtime

 

国控空气检测站点分布数据

数据提供: 上海青悦环保

数据字段: 省份、城市、城市编码、站点、站点编码、经度、纬度、参照点

数据范围:全国站点

示例数据:  上海部分空气监测站数据.csv

表名: nation_air_station

 

国控地表水基础信息数据

数据提供: 上海青悦环保

数据字段: 编号、名称、所属流域、断面属性、经度、纬度、简介、托管方、设立时间、工作情况

数据范围:全国空气监测站点

示例数据: 国控地表水监测站基础信息.csv

表名: nation_water_station

 

国控地表水站点监测数据

数据提供: 上海青悦环保

数据字段: 站点编号、时间、PH值、PH值水质类别、溶解氧、溶解氧级别、氨氮、氨氮级别、高锰酸盐、高锰酸盐级别、总有机碳、总有机碳级别

数据范围: 2015年全国国控地表水监测数据

示例数据 :重庆朱沱部分国控地表水监测数据.csv

表名: tc_ nation_water

 

污染排放企业信息数据

数据提供: 上海青悦环保

数据字段: 企业ID 公司名称、机构代码、法人、联系人、联系电话、污染源名称、污染源类别、 地区、国控/非国控 、所属行业、地址、纬度、经度、高度纬度、高德经度、百度纬度、百度经度、记录创建时间、生产周期、省、市、企业编号、简介、原站ID,数据年份

数据范围:山东、江苏地区2015年污染排放企业信息

示例数据: 山东部分污染源企业信息.csv

表名: tc_crawlerapp_companies

 

污染企业监测站点信息数据

数据提供: 上海青悦环保

数据字段: ID、污染企业ID、qyid、sbid、监测站点名称、监测站点编码、排放方式、排放方向、是否委托监测、委托监测公司、质量控制、位置图片、位置图片地址、设备名称、数据创建时间、补充站点名称、 发布方式

数据范围: 山东2015年企业所属监测点基础信息

示例数据: 污染企业监测站点信息.csv

表名: crawlerapp_monitor_points

 

污染企业监测站点监测项目信息数据

数据提供: 上海青悦环保

数据字段: ID、监测站点ID、监测项目名、监测频率、最大值、最小值、来源、监测方式、发布时间、数据创建时间、最大值单位、最小值单位、监测项目类型、监测站点编码

数据范围: 山东2015年企业所属监测点的监测项目基础信息

示例数据:污染企业监测站点监测项目信息.csv

表名: crawlerapp_monitor_infos

 

山东企业污染排放国控监测数据

数据提供: 上海青悦环保

数据字段: ID、监测点ID、监测点位、监测频率、监测项目ID、监测值、监测时间、监测方式、是否超标、exceedtype:超标类型(超上限还是超下限,一般只有ph才有超下限,其他基本都是上限)、超标倍数、数据保存时间、数据状态、备注、省份、标准上值、标准下值

数据范围:山东2015年污染企业排放监测记录

示例数据 :山东部分企业污染排放记录.csv

表名: tc_crawlerapp_results

 

江苏省企业污染排放记录

数据提供: 上海青悦环保

数据字段: 时间、监测点、工厂名称、行业、机构代码、是否国控、状态、执行标准、旧执行标准、SO2、SO2折算值、NO2、NOx折算、Dust、Dust折算、SO2限值、SO2旧限值、NOx限值、NOx、旧限值、DUST限值、DUST旧限值

数据范围:江苏2015年污染企业排放监测记录

示例数据: 江苏部分污染企业排放监数据.csv

表名: tc_crawlerapp_results_js

 

2. 其他参考数据来源

数据源名称 数据源名称 数据源名称
中国天气网 青悦环境数据开放平台 中国科学院资源环境科学中心
ENVICLOUD环境云 深圳气象数据网 国家地球系统科学数据库
全球地理GeoJSON数据 全球行政区数据库 SVG-EPS地图
Geomap.js中的中国地理数据 国家数据平台 地球系统科学数据共享平台
环境部地表水质监测站实时数据 统计局统计数据 全国主要流域重点断面水质自动监测周报
全国城市空气质量监测 水质监测因子分析-任意时间段 自定义水质级别分析
我国运行核电站周围环境空气吸收剂量率 全国辐射环境自动监测站空气吸收剂量率 公共卫生科学数据
国家人口与健康科学数据共享平台 北京市卫生局 卫生部统计数据
北京市政府数据资源网 上海

 

三、工具与学习资料

1. 本次大赛参赛工具不做限制,选手可自行选择。以下推荐2款 可视化与数据分析工具 ,供选手参考和使用

1)阿里云DataV数据可视化 http://data.aliyun.com/visual/datav

相比于传统图表与数据仪表盘,如今的数据可视化致力于用更生动、友好的形式,即时呈现隐藏在瞬息万变且庞杂数据背后的业务洞察。无论在零售、物流、电力、水利、环保、还是交通领域,通过交互式实时数据可视化视屏墙来帮助业务人员发现、诊断业务问题,越来越成为大数据解决方案中不可或缺的一环。

DataV旨让更多的人看到数据可视化的魅力,帮助非专业的工程师通过图形化的界面轻松搭建专业水准的可视化应用。DataV提供丰富的可视化模板,满足您会议展览、业务监控、风险预警、地理信息分析等多种业务的展示需求。

 

 

 

2) 支付宝G2可视化 https://g2.alipay.com

G2(The Grammar Of Graphics) 是一个由纯  javascript  编写、强大的语义化图表生成工具,它提供了一整套图形语法,可以让用户通过简单的语法搭建出无数种图表,并且集成了大量的统计工具,支持多种坐标系绘制,可以让用户自由地定制图表,是为大数据时代而准备的强大的可视化工具。

 

 

2. 学习资料

1) 云栖社区

2) 第二届高校数据新闻报道大赛获奖作品

3) 数据新闻网

4) 雪晴数据网

5) 统计之都