为加快推动人工智能及大模型技术在金融科技领域的应用转化,助力挖掘优质创新创业方案,强化科技人才高地聚集氛围,在上海市科学技术委员会指导下,上海市科技创业中心支持,由国内外多家顶尖学术机构和知名金融科技企业联合发起了“AFAC2025金融智能创新大赛”。 大赛设立算法赛、应用赛的综合赛制结构,旨在以真题促真力,以金融行业内真实案例及海量真实数据为牵引,同时设立丰厚的奖金池,鼓励业内外具有潜力的创新者积极参与,将赛事成果应用到实际产业中。
当今金融科技正经历前所未有的变革,智能投研、智能投顾等应用展现出广阔前景。金融研究报告(研报)作为金融领域的核心产出,在基金管理、资产管理、投行等机构决策中起着重要作用。
在金融场景中,复杂推理任务广泛存在于风险评估、财务审计、合规检查等关键流程中。这些任务通常要求模型执行多步、严谨的复杂逻辑推理,并综合运用法律、财务、经济等多学科知识进行判断。
作为一站式理财服务平台,蚂蚁财富为广大投资者提供了便捷且高效的基金交易功能,每天支撑大规模基金申购和赎回交易。
在金融保险行业中,电子保单、保险条款、营销物料等素材的合规性与一致性关乎业务的稳健发展。当前,行业普遍依赖人工核验多源文件内容,存在两大痛点:一是效率瓶颈,长文档(如条款文本、免责声明)的逐项比对耗时耗力;二是动态规则适配难,随着经济发展,保险市场环境也在不断变化,同时,保险产品类目众多,产品迭代频繁,这种动态性为合规校验系统提出了更高的要求。
随着大语言模型(Large Language Model, LLM)在自然语言理解与生成任务中的突破性进展,其在网络舆情监测领域的应用潜力日益凸显。网络媒体内容的立场分析与态势感知是网络空间治理的核心命题
随着生成式人工智能技术的快速演进,以DeepSeek、GPT-4o、Qwen等为代表的生成式大模型正深刻改变着各行业生态。这些基于海量数据训练的系统展现出强大的内容理解和生成能力,但同时也暴露出不容忽视的安全隐患。研究表明,这类模型在外部恶意操控下可能生成具有社会危害性的内容,其固有的"幻觉"特性会导致无意识输出虚假信息,而对抗性攻击者通过特定提示词即可绕过现有安全机制。尽管当前已有多个安全评估框架和竞赛活动,但普遍存在对中文语境风险要素覆盖不足、评估场景单一化、忽略CoT内容风险等问题,难以全面揭示生成式大模型在实际应用中的综合安全风险。鉴于此,蚂蚁数科在IJCAI 2025 Workshop发起专项挑战赛,聚焦中文环境下的生成式大模型安全攻防实践。
面向社交媒体的事件脉络生成是舆情监控和新闻追踪的重要任务,旨在实时把握热点发展,为风险评估与应对提供支持。该任务面临两大挑战:一是需从多源时间戳文档中提取关键事件并按时间组织,确保内容真实、逻辑清晰;二是需根据用户指令灵活调整事件粒度,兼顾全局与细节。评测将从信息丰富度、粒度一致性与事实性等维度,衡量模型在生成符合不同粒度需求的事件脉络能力。语料来源广泛,覆盖多领域、多层级时间线,提供权威评估基准。
文档结构化提取旨在从非结构化文档(如PDF)中提取语义内容,是构建知识库、支持RAG应用的关键技术。中国科学院软件研究所在CCKS2025大会上组织文档端到端结构化评测,该任务以完整、多页的PDF文档作为输入,输出语义结构化的Markdown文本,涵盖标题层级、公式、表格等语义单元。通过构建跨领域、多语言的数据集和标准化评估框架,本评测旨在推动文档结构化技术向实用化发展。
《人工智能领域论文复杂问题问答评测》由东南大学与华为诺亚方舟实验室联合举办,聚焦学术文献深度理解与推理的挑战。参赛系统需基于英文论文全文回答多选问题,每个问题含多个正确答案,考验模型的长文本解析、多跳推理及批判性分析能力。评测数据集涵盖85篇顶会顶刊论文和225道专家标注题目,涉及实验验证、理论推导等场景,要求模型整合术语、公式、图表及隐含逻辑,严谨排除干扰选项。与传统问答任务不同,本评测强调非结构化文本的语义挖掘和高阶推理,推动智能文献综述、科研助手等应用发展。