天池数据集

天池数据集_阿里系唯一对外开放数据分享平台

行业:
全部

商业

互联网

金融

医疗健康

政治人文

计算机科学

工程交通

安全

自然科学

时尚艺术

工业制造

农业

电子商务

教育

娱乐

生物基因

本地服务

环境

设计

展开
技术:
全部

计算机视觉

自然语言处理

分类

目标检测

语音识别

机器学习

建模

推荐系统

深度学习

视频数据

光学字符识别

多模态

决策优化

计算广告学

网络

回归

可靠性

信息检索

搜索

异常检测

展开
精华
更新时间
热度

中文医疗信息处理评测基准CBLUE

置顶打榜

中文医疗信息处理挑战榜CBLUE(Chinese Biomedical Language Understanding Evaluation)是中国中文信息学会医疗健康与生物信息处理专业委员会在合法开放共享的理念下发起,由阿里云天池平台承办,并由医渡云(北京)技术有限公司、腾讯天衍实验室、平安医疗科技、阿里夸克、北京大学、郑州大学、鹏城实验室、哈尔滨工业大学(深圳)、同济大学、中山大学、复旦大学、华东师范大学等开展智慧医疗研究的单位共同协办,旨在推动中文医学NLP技术和社区的发展。
官网地址: https://tianchi.aliyun.com/cblue
论文: https://arxiv.org/pdf/2106.08087.pdf
Github: https://github.com/CBLUEbenchmark/CBLUE

天池小喵萌2021-03-22347922731416938307

大规模中文多模态评测基准MUGE

置顶打榜

多模态理解和生成评估挑战榜(MUGE)是由阿里巴巴达摩院智能计算实验室发起,由阿里云天池平台承办,并由浙江大学、清华大学等单位共同协办。 MUGE榜单为研究者们提供了统一的数据和评测基准,旨在促进多模态理解与生成领域的技术发展。
官网地址:https://tianchi.aliyun.com/muge
Github:https://github.com/MUGE-2021 , https://github.com/OFA-Sys/Chinese-CLIP

天池小喵萌2021-07-2867956168940572

OpenBG Benchmark:大规模开放数字商业知识图谱评测基准

置顶打榜

OpenBG Benchmark是一个大规模开放数字商业知识图谱评测基准,包含多个子数据集和子任务。数据集以开放的数字商业知识图谱OpenBG为基础构建,OpenBG是开放的数字商业知识图谱,是一个使用统一Schema组织、涵盖产品和消费需求的百万级多模态数据集。OpenBG由阿里巴巴藏经阁团队和浙江大学联合提供,开放的目标是利用开放的商业知识发现社会经济的价值,促进数字商务数字经济等领域的交叉学科研究,服务数字经济健康发展的国家战略需求。

Website: https://tianchi.aliyun.com/OpenBG
Github: https://github.com/OpenBGBenchmark

AliOpenKG2022-03-0820613214300294

淘宝母婴购物数据集

置顶

本数据集由淘宝&天猫提供。

天池小喵萌2018-04-0281575194236486249

阿里移动推荐算法数据集

置顶

本数据集来自“阿里移动推荐算法挑战赛”: https://tianchi.aliyun.com/competition/entrance/1/information

为了方便研究人员进行算法测试,我们开放了长期的学习赛: https://tianchi.aliyun.com/competition/entrance/532043/information 。
此外,我们还基于本数据集,提供了一个数据可视化的教程,方便学习者进行数据分析方面的代码实践:https://tianchi.aliyun.com/competition/entrance/532059/information

天池小喵萌2018-04-024501689518858341

天猫推荐数据集Rec-Tmall

置顶

本数据集来自首届天猫推荐算法比赛,由天猫提供。
TMALL is an important business unit of Alibaba Group. As the top B2C platform in China. "REC-TMALL" is a set of RECommendation-related data provided by TMALL.

天池小喵萌2022-11-01197563166247214

BAAI/IndustryInstruction_Travel-Geography

行业指令数据在推动行业应用快速落地的场景中发挥着重要的作用。当前的行业指令数据存在着如下的挑战:1.行业数据缺失 2.数据质量参差不齐 3.数据维度相对单一,只存在某些特定场景下的数据

天池小喵萌2024-11-051711623172

BAAI/IndustryInstruction_Health-Medicine

行业指令数据在推动行业应用快速落地的场景中发挥着重要的作用。当前的行业指令数据存在着如下的挑战:1.行业数据缺失 2.数据质量参差不齐 3.数据维度相对单一,只存在某些特定场景下的数据

天池小喵萌2024-11-052962922171

BAAI/IndustryInstruction_Finance-Economics

行业指令数据在推动行业应用快速落地的场景中发挥着重要的作用。当前的行业指令数据存在着如下的挑战:1.行业数据缺失 2.数据质量参差不齐 3.数据维度相对单一,只存在某些特定场景下的数据

天池小喵萌2024-11-05104711714

BAAI/IndustryCorpus2_tourism_geography

行业模型在推动企业智能化转型和创新发展中发挥着至关重要的作用。高质量的行业数据是提升大模型性能和实现行业应用落地的关键。然而,目前用于行业模型训练的数据集普遍存在数据量少、质量低、专业性不足等问题。

天池小喵萌2024-11-05205818130