公告:[KDD CUP 2017] Data sets released!Download>>

首页 > 天池大赛 > IJCAI-17 口碑商家客流量预测 | 赛题与数据
  • 状态 举办方 第 2 赛季截止日期 总奖池 参赛队

    IJCAI-17 口碑商家客流量预测

    已结束 2017/03/14 $37000 4058

    报名参赛

文件名称 (报名后可下载)

文件格式

extra_user_view.zip

.zip (25MB)

md5.txt

.txt (214B)

prediction_example.csv

.csv (91KB)

dataset (淘盘)

download

dataset (mirror link - dropbox)

download

dataset (mirror link - box.com)

download

口碑商家客流量预测

背景 Background

随着移动定位服务的流行,阿里巴巴和蚂蚁金服逐渐积累了来自用户和商家的海量线上线下交易数据。蚂蚁金服的O2O平台“口碑”用这些数据为商家提供了包括交易统计,销售分析和销售建议等定制的后端商业智能服务。举例来说,口碑致力于为每个商家提供销售预测。基于预测结果,商家可以优化运营,降低成本,并改善用户体验。
这次比赛中,我们将以恰当定义的销售预测问题为题。 我们鼓励创新的解法,帮助口碑成为更加智能的商业平台,更好地服务社会。同时,希望每位参赛选手都能享受到这次比赛带来的乐趣。

问题 Statement

预测客户流量对商家的经营管理至关重要。在口碑平台上,我们将客户流量定义为“单位时间内在商家使用支付宝消费的用户人次”。在这个问题中,我们将提供用户的浏览和支付历史,以及商家相关信息,并希望参赛选手可以以此预测所有商家在接下来14天内,每天的客户流量。
我们鼓励参赛选手使用类似天气等额外的数据,并希望参赛选手能够将数据源共享在论坛中

评测 Evaluation

在这次比赛中,每只队伍需要预测测试集中所有商家在未来14天(2016.11.01-2016.11.14)内各自每天(00:00:00-23:59:59)的客户流量。预测结果为非负整数。

数据 Data

我们提供从2015.07.012016.10.31(除去2015.12.12商家数据,用户支付行为数据以及用户浏览行为数据。提供数据的类型统一为string类型提交预测的类型为整形。文件统一为utf-8编码,没有标题行,并“,”分隔的csv格式
  
1. shop_info商家特征数据

Field

Sample

Description

shop_id

000001

商家id

city_name

北京

市名

location_id

001

所在位置编号,位置接近的商家具有相同的编号

per_pay

3

人均消费(数值越大消费越高

score

1

评分(数值越大评分越高)

comment_cnt

2

评论数(数值越大评论数越多)

shop_level

1

门店等级(数值越大门店等级越高)

cate_1_name

美食

一级品类名称

cate_2_name

小吃

二级分类名称

cate_3_name

其他小吃

三级分类名称

2.     user_pay:用户支付行为

Field

Sample

Description

user_id

0000000001

用户id

shop_id

000001

商家id,与shop_info对应

time_stamp

2015-10-10 11:00:00

支付时间

3.     user_view:用户浏览行为

Field

Sample

Description

user_id

0000000001

用户id

shop_id

000001

商家id,与shop_info对应

time_stamp

2015-10-10 10:00:00

浏览时间

4.     prediction测试集与提交格式

Field

Sample

Description

shop_id

000001

商家id

day_1

25

1天的预测值( 需要选手提供)

day_2

3

2天的预测值(需要选手提供)

……

 

 

day_14

1024

14天的预测值( 需要选手提供)

 


关于天池

了解更多,请关注天池微信

切换语言