中文医疗信息处理评测基准CBLUE
置顶打榜中文医疗信息处理挑战榜CBLUE(Chinese Biomedical Language Understanding Evaluation)是中国中文信息学会医疗健康与生物信息处理专业委员会在合法开放共享的理念下发起,由阿里云天池平台承办,并由医渡云(北京)技术有限公司、腾讯天衍实验室、平安医疗科技、阿里夸克、北京大学、郑州大学、鹏城实验室、哈尔滨工业大学(深圳)、同济大学、中山大学、复旦大学、华东师范大学等开展智慧医疗研究的单位共同协办,旨在推动中文医学NLP技术和社区的发展。
官网地址: https://tianchi.aliyun.com/cblue
论文: https://arxiv.org/pdf/2106.08087.pdf
Github: https://github.com/CBLUEbenchmark/CBLUE
大规模中文多模态评测基准MUGE
置顶打榜多模态理解和生成评估挑战榜(MUGE)是由阿里巴巴达摩院智能计算实验室发起,由阿里云天池平台承办,并由浙江大学、清华大学等单位共同协办。 MUGE榜单为研究者们提供了统一的数据和评测基准,旨在促进多模态理解与生成领域的技术发展。
官网地址:https://tianchi.aliyun.com/muge
Github:https://github.com/MUGE-2021 , https://github.com/OFA-Sys/Chinese-CLIP
OpenBG Benchmark:大规模开放数字商业知识图谱评测基准
置顶打榜OpenBG Benchmark是一个大规模开放数字商业知识图谱评测基准,包含多个子数据集和子任务。数据集以开放的数字商业知识图谱OpenBG为基础构建,OpenBG是开放的数字商业知识图谱,是一个使用统一Schema组织、涵盖产品和消费需求的百万级多模态数据集。OpenBG由阿里巴巴藏经阁团队和浙江大学联合提供,开放的目标是利用开放的商业知识发现社会经济的价值,促进数字商务数字经济等领域的交叉学科研究,服务数字经济健康发展的国家战略需求。
Website: https://tianchi.aliyun.com/OpenBG
Github: https://github.com/OpenBGBenchmark
淘宝母婴购物数据集
置顶本数据集由淘宝&天猫提供。
阿里移动推荐算法数据集
置顶本数据集来自“阿里移动推荐算法挑战赛”: https://tianchi.aliyun.com/competition/entrance/1/information
为了方便研究人员进行算法测试,我们开放了长期的学习赛: https://tianchi.aliyun.com/competition/entrance/532043/information 。
此外,我们还基于本数据集,提供了一个数据可视化的教程,方便学习者进行数据分析方面的代码实践:https://tianchi.aliyun.com/competition/entrance/532059/information
天猫推荐数据集Rec-Tmall
置顶本数据集来自首届天猫推荐算法比赛,由天猫提供。
TMALL is an important business unit of Alibaba Group. As the top B2C platform in China. "REC-TMALL" is a set of RECommendation-related data provided by TMALL.
BAAI/IndustryInstruction_Travel-Geography
行业指令数据在推动行业应用快速落地的场景中发挥着重要的作用。当前的行业指令数据存在着如下的挑战:1.行业数据缺失 2.数据质量参差不齐 3.数据维度相对单一,只存在某些特定场景下的数据
BAAI/IndustryInstruction_Health-Medicine
行业指令数据在推动行业应用快速落地的场景中发挥着重要的作用。当前的行业指令数据存在着如下的挑战:1.行业数据缺失 2.数据质量参差不齐 3.数据维度相对单一,只存在某些特定场景下的数据
BAAI/IndustryInstruction_Finance-Economics
行业指令数据在推动行业应用快速落地的场景中发挥着重要的作用。当前的行业指令数据存在着如下的挑战:1.行业数据缺失 2.数据质量参差不齐 3.数据维度相对单一,只存在某些特定场景下的数据
BAAI/IndustryCorpus2_tourism_geography
行业模型在推动企业智能化转型和创新发展中发挥着至关重要的作用。高质量的行业数据是提升大模型性能和实现行业应用落地的关键。然而,目前用于行业模型训练的数据集普遍存在数据量少、质量低、专业性不足等问题。