阿里巴巴学术会议论文解读

NeurIPS2020

NeurIPS作为学术界、工业界公认的人工智能领域国际顶级会议，代表着当今人工智能研究的最高水平。今年，NeurIPS的论文投稿量增加了38%，共提交了12115篇论文摘要，9467篇论文，其中11%的论文被直接拒绝，最终接收论文1900篇，接收率约20.1%，创历史新低。NeurIPS 2020阿里巴巴有23篇论文被大会收录，数量刷新了阿里的记录。

Latent Template Induction with Gumbel-CRFs _________________________

符尧-爱丁堡大学自然语言处理研究组

本文提出了一种梯度中心化的神经网络优化策略。通过对神经网络的权重的梯度进行中心化，来加速优化算法的收敛速度并且提升泛化性能。

Long-Tailed Classification by Keeping the Good and Removing the Bad Momentum Causal Effect

汤凯华-达摩院-机器智能技术-城市大脑实验室

长尾分布是指常见的不均衡数据分布，该问题大大降低了机器学习模型的鲁棒性，并且需要利用高昂的成本去采集罕见数据才能解决。该工作利用因果分析技术...

观看作者解读

Incorporating BERT into Parallel Sequence Decoding with Adapters

郭俊良-达摩院-机器智能技术-自然语言智能-翻译平台

我们提出采用两种不同的BERT模型分别作为编码器和解码器，并引入简单、轻量级的adapter模块，将这些模块插入到BERT层之间，针对下游任务数据集进行微调。这样就得到了一个灵活高效的模型，它能够联合利用源端和目标端BERT模型中包含的信息，同时绕开了灾难性遗忘问题。

观看作者解读

Causal Intervention for Weakly-Supervised Semantic Segmentation

张冬-南京理工大学-智能媒体分析实验室

弱监督语义分割是指通过一些容易获取的标签对输入图像中的每一个像素都进行类别预测。

观看作者解读

Hard Example Generation by Texture Synthesis for Cross-domain Shape Similarity Learning

木剑-新零售技术事业群-淘系技术部-商业机器智能部

随着3D模型数量的增长，研究高精的2D图搜3D模型（IBSR）问题对于推进3D数字化建设意义重大。本次分享我们组在NeurIPS20上提出的一种新的IBSR思路“Hard Example Generation by Texture Synthesis for Cross-domain Shape Similarity Learning”。

观看作者解读

Neuron-level Structured Pruning using Polarization Regularizer

瑞溪-新零售智能引擎事业群-搜索推荐事业部-算法技术-搜索算法技术-基础排序和用户画像

神经网络已经成为搜索、推荐、广告领域应用最广泛的模型，但是其巨大的计算消耗一直是工业界和学术界面临的一大难题。为此我们提出了一个全新的“两极化”正则方法，通过剪除神经网络中冗余的神经元，在保证预测效果不变的情况下，极大地减少神经网络的计算消耗。

观看作者解读

Learning to Mutate with Hypergradient Guided Population

Yaliang Li-新零售智能引擎事业群-智能计算实验室

自动机器学习AutoML中的超参优化HPO，能够以数据驱动的方式，自动设置参数配置。我们最新的NeurIPS'2020论文 “Learning to Mutate with Hypergradient Guided Population”，从 “可学习突变” 的角度提供了一种基于群体训练和超梯度下降的动态超参优化算法。

观看作者解读

ECCV2020

2020年国际三大计算机视觉顶尖会议之一的ECCV （欧洲计算机视觉国际会议）已经在8月23日线上拉开帷幕。大会官方公布了2020年论文收录结果，2020投稿量再创新高，共5025篇有效投稿，相较上届翻了一倍多。投稿激增的同时，接收率却大幅下降，今年ECCV共接收发表文章1361篇，接收率为27%，相比上届降低近5%，其中Oral论文接收率仅为2%，堪称史上最难ECCV。

Gradient Centralization: A New Optimization Technique for Deep Neural Networks

鴻巍-阿里巴巴达摩院AIC深圳团队-实习生

本文提出了一种梯度中心化的神经网络优化策略。通过对神经网络的权重的梯度进行中心化，来加速优化算法的收敛速度并且提升泛化性能。

观看作者解读

Suppress and Balance: A Simple Gated Network for Salient Object Detection

卢湖川-大连理工大学-教授

本文首先对显著性目标检测及其应用做一简单介绍，然后回顾现有的显著性目标检测网络以及分析其方法的局限性。

观看作者解读

Label Propagation with Augmented Anchors: A Simple Semi-Supervised Learning baseline for Unsupervised Domain ...

张亚斌-阿里巴巴达摩院-实习生

本研究隶属于利用【标注数据和未标注数据的集合】来学习模型。以半监督学习的经典算法-标签传播算法为例，研究了当标注数据与未标注数据数据分布不同时，需要如何对标签传播算法做适当修改。

观看作者解读

A Single Stream Network for Robust and Real-time RGB-D Salient Object Detection

赵骁琪-大连理工大学-研究生

提出了一个新颖的单流RGB-D显著性检测网络，以直接使用深度图为RGB提供早期区分特征来实现编码器的单流结构，并取代了以往需要针对深度信息使用额外特征编码器的方式，实现了整体结构的轻量级设计。

观看作者解读

The Why in Vision

特约嘉宾-达摩院城市大脑-访问学者-张含望

关联不等于因果。人类的智能推理是基于我们人类特有的问“为什么”的能力。通过问“为什么”我们可以找出变量之间的因果关系，根据这个关系来学习统计模型，然后基于该模型进行推理。我会介绍我南洋理工MReaL实验室和城市大脑团队在最近半年以来在计算机视觉上运用因果关系上做出的基础研究，比如视觉对话系统，无监督特征学习，小样本学习，弱监督场景分割，长尾样本学习，以及视觉场景图检测。

观看作者解读

Weakly Supervised Learning with Side Information

达摩院-机器智能实验室-算法专家-佚南

目前DNNs在Labeled Data上的识别性能已趋于饱和，如何利用大规模Web Noisy Data继续提升DNNs的识别能力，是近几年学术界和工业界研究的热点问题。本文提出了一种基于弱监督学习的Side Information Network (SINet)，通过Side Information构建类间的Relation Graph，然后通过Graph Matching的方式计算类别的Visual Prototype，最后利用Noise Weighting降低Noisy Data对模型训练的干扰。

观看作者解读

Suppress and Balance: A Simple Gated Network for Salient Object Detection

达摩院AIC深圳团队-研究型实习生-李晓明

目前存在的基于引导图的人脸图像修复，虽然一定程度能够处理真实图像，但是依赖于一张或者多张身份一致的人脸图像作为引导，因此只能应用在特定场合。为了解决上述问题，我们提出一种基于多尺度的人脸部位特征字典的方式。由于人脸具有固定的结构（眼睛，鼻子，嘴），我们首先离线的从一批高质量的人脸图像中，提取这些部位的特征，通过k均值的方式聚类成部位字典。然后在训练人脸增强网络中，我们对输入的退化图像中眼睛鼻子嘴部位特征通过遍历已经构建好的字典，获得最匹配的高质量特征作为引导，对人脸图像进行复原重建。

观看作者解读

A Decoupled Learning Scheme for Real-world A Decoupled Learning Scheme for Real-world Burst Denoising

达摩院AIC深圳团队-研究型实习生-梁哲通

拍摄多帧图像来进行联合去噪是一种十分有效的图像降噪技术。通过数据驱动的多帧降噪任务重主要有两类子任务，一是从输入的多帧动态图像中学习图像配准以补偿物体的运动，二是学习去除真实的噪声。然而，由于运动物体的存在，构造真实的多帧去噪数据集中的干净ground truth图像是非常困难的。为此，本文提出一种解耦学习的策略来训练真实多帧去噪网络，采用两种互补的数据集来进行训练，一方面从真实静态多帧数据集中学习真实噪声的去除，另一方面从动态仿真的视频数据集中学习帧间的配准。基于这种策略，我们训练的去噪网络能够很好的对真实场景中的多帧图像进行联合降噪。

观看作者解读

EMNLP2020

EMNLP是计算语言学和自然语言处理领域顶级国际会议之一，EMNLP 2020接收的论文覆盖了对话交互系统、信息抽取、信息检索和文档分析、词法语义、语言学理论、认知建模和心理语言学、用于NLP的机器学习、机器翻译与多语言、问答、句子级语义学、情感分析和论点挖掘、文本挖掘和NLP应用、文本推理等自然语言处理领域众多研究方向。本届会议阿里巴巴被收录28篇论文，在数量上实现了突破。

APE: Argument Pair Extraction from Peer Review and Rebuttal via Multi-task Learning

达摩院-机器智能技术-自然语言智能-新加坡实验室-程丽颖

本文提出了一个论辩对挖掘的新任务，即在较长篇幅的辩论文本上进行论辩对挖掘，与辩论挖掘领域已有的任务有显著区别。同时，还提出了一个多层长短期记忆结构的多任务训练模型。本方案提出的多任务训练模型，解决了当前任务和模型中遇到的问题，可被广泛应用于论辩挖掘领域的研究中，如辩论机器人项目、电商评论、智能司法项目等。

观看作者解读

DAGA: Data Augmentation with a Generation Approach forLow-resource Tagging Tasks

达摩院-机器智能技术-自然语言智能-新加坡实验室-丁博生/刘林林

本文提出了一种新的用于序列标注任务的数据增强技术。不同于以往提出的同义词替换或者针对翻译任务的反向翻译等数据增强方法，我们提出的方法通过线性化的方式把文本数据和序列标注变成语言模型的输入数据，从而通过语言模型，生成更多的训练数据，以此达到数据增强的目的。此方法可以显著提高NER, POS, ABSA等下游序列标注任务在低资源场景下的准确率。

观看作者解读

ENT-DESC: Entity Description Generation by Exploring Knowledge Graph

达摩院-机器智能技术-自然语言智能-新加坡实验室-程丽颖

本文提出了一种新的借助于知识图谱的主题化实体描述文本生成的任务。主题化实体描述是在给定主要实体的前提下，通过多个主要实体的附属主题实体，对主题实体的描述有一定的导向和限制作用。相较于现有的生成任务更具有实用性和挑战性。本方案对此新任务提出了一个多图卷积神经网络的文本生成模型。本方案提出的任务设定以及算法模型，解决了当前任务和模型中遇到的问题，可被广泛应用于各类以图结构为基础的实际文本生成任务中，如产品描述生成、数据官项目等。

观看作者解读

An Unsupervised Sentence Embedding Method by Mutual Information Maximization

达摩院-机器智能技术-自然语言智能-新加坡实验室-何瑞丹

本文提出了一种轻量级的无监督句子表示学习模型，即通过最大化全局表示（句子表示）与局部表示（n-gram表示）之间互信息进行自监督地学习更适合分类的句子表示。该模型在各种基准任务上都优于之前无监督的句子表示方法。而相比当前最好的有监督句子表示学习模型，我们的模型可以摆脱数据领域和数据标注的限制同时保证不错的正确率和效率。而学习到的句子表示。可用于丰富的文本匹配应用，包括文本相似度计算、自然语言推理、问答系统、信息检索等。

观看作者解读

VLDB2020

VLDB是数据库领域三大顶级会议之一，其内容范围广，思路开阔。除传统的优化器、引擎、分布式执行、事务并发控制等内容以外，还有大量的大数据处理、图数据、空间数据、文本及半结构化数据、流数据、数据挖掘和分析、众包、社交网络分析、可视化等方面的内容。

2020年，VLDB收到750篇论文投稿，共95篇被接收，接受率不到18%（其中，PHD Workshop 13篇；Industrial Track 31篇；Demo Track 51篇）整体内容覆盖traditional database system、data analysis、data management、spatial and graph和machine leaning等领域，SQL的运用仍被多篇论文关注。整体上看，数据库领域研究呈现出两个研究热点：其一是基于新硬件特性的数据库原型系统（新硬件在多和计算、执行计划、储存架构等方面的研究）；其二是传统关系数据库技术在大数据处理平台的应用，在提高处理性能同时降低门槛。

数据库顶会VLDB 2020 中, 来自数据库产品事业部、计算平台事业部、新零售智能引擎智计算团队的13篇论文被大会收录，国内第一。

AnalyticDB-V：A Hybrid Analytical Engine Towards Query Fusion for Structured and Unstructured Data

数据库产品事业部-OLAP产品部-魏闯先

本文介绍了AnalyticDB支持结构化数据和非结构化数据(向量)的检索，使用SQL接口就可以快速的搭建起视频、音频、图片、文本等非结构化数据与结构化数据混合检索等功能。

观看作者解读

Diagnosing Root Causes of Intermittent Slow Queries in Large-Scale Cloud Databases

数据库产品事业部- 数据库自治服务DAS-殷征

本文介绍了Autonomous Diagnose通过数据驱动的方式，诊断云数据库的间歇性慢查询的根因，帮助DAS系统实现自动驾驶的相应自治功能。

观看作者解读

Collecting and Analyzing Data Jointly from Multiple Services under Local Differential Privacy

智能计算实验室-智能系统-丁博麟

本文介绍如何对多源多表数据进行数据融合，融合过程保障差分隐私和保护频率攻击，同时融合后的数据上可以进行OLAP查询，得到近似结果。

观看作者解读

Alibaba Hologres: A Cloud-Native Service for Hybrid Serving/Analytical Processing

计算平台事业部-云原生数据仓库-蒋晓伟

本文介绍了HSAP的场景以及Hologres如何实现一个云原生的高性能HSAP系统。

观看作者解读

Maximum Biclique Search at Billion Scale

智能计算实验室-在线图计算-吕冰清

本文提出了一种新颖的在大规模图上查找最大完全二分图的算法，可应用于刷单检测、异常查询等场景，并在大量实验中验证了该方法的高效性及高可扩展性。

观看作者解读

ACL 2020

ACL年会是计算语言学和自然语言处理领域最重要的顶级国际会议，CCF A类会议，由计算语言学协会主办，每年举办一次。其接收的论文覆盖了对话交互系统、语义分析、摘要生成、信息抽取、问答系统、文本挖掘、机器翻译、语篇语用学、情感分析和意见挖掘、社会计算等自然语言处理领域众多研究方向。本届ACL2020阿里18篇论文被大会收录，数量国内第一，阿里线上参与会议的展示介绍NLP研究。

Senior Algorithm Engineer SpanMlt: A Span-based Multi-Task Learning Framework for Pair-wise Aspect

阿里安全-安全智能-黄龙涛（开阳）

这次分享会介绍一种用于属性级情感分析中属性与情感配对抽取的多任务学习框架。

观看作者解读

Coupling Distant Annotation and Adversarial Training for Cross-Domain Chinese Word Segmentation

达摩院-机器智能技术-丁宁

本次分享会介绍一种融合了远程监督和对抗学习的大规模跨领域分词框架。

观看作者解读

Dynamic Memory Induction Networks

达摩院-机器智能技术-耿瑞莹（彧琛）

我们提出基于动态记忆归纳网络的少样本学习方法，通过动态路由构建记忆模块，能够有效利用模型之前的学习经历以适应新的类别和支撑集。

观看作者解读

Multi-Domain Dialogue Acts and Response Co-Generation

达摩院-机器智能技术-田俊峰

这次分享会介绍多领域任务型对话中，我们提出的对话动作和回复联合生成模型（MarCo）。

观看作者解读

Multiscale Collaborative Deep Models

达摩院-机器智能技术-魏相鹏

我们提出一种基于多尺度协作(MSC)机制的深度神经机器翻译模型，以提高模型对具象化和抽象化特征的建模能力。

观看作者解读

Knowledge Distillation For Multilingual Sequence Labeling

达摩院-机器智能技术-王新宇

我们提出了两种创新的基于序列标注的结构层级信息的知识蒸馏方式，将多个单语言模型的知识蒸馏到单个多语言模型上，从而减少了单语言模型和多语言模型之间准确度的差距。

观看作者解读

CVPR2020

本届CVPR 2020会议共收到投稿5865篇，最终收录1470篇，接受率22%，历年最低。线上会议 CVPR2020 注册人数仍达到 7000人，其中华人占比 39.2%，阿里云支持了CVPR线上会议的中国所有访问。本届会议阿里巴巴共18篇论文被大会收录，达摩院机器视觉实验室主办RetailVision Workshop 以及Ali Product Workshop Challenge ，比赛吸引688个队伍报名。竞赛方面，达摩院视觉智能在 DAVIS Semi-supervised Challenge和HACS ActivitNet 两项比赛中获得第一，淘宝技术团队在Deepfashion 比赛中获得第一。

CVPR 2020 AliProducts Challenge:Large-scale Product Recognition

达摩院-视觉技术-图像分析与理解-启磐

We held a competition proposed for studying the large-scale and fine-grained commodity image recognition problem based on a large new dataset (3 million images cover 50,000 SKU products) released by Alibaba.

观看作者解读

Artificial Intelligence Center CPR-GCN: Conditonal Partial-Residual Graph Convolutional Network

达摩院-机器智能技术-昕翼

In Clinic，it is very labor exhaustive for doctor to label coronary arteries before disease recognition. We proposed a novel CPR-GCN method to fully automate this process, with >8% higher accuracy than state-of-the-art methods.

观看作者解读

Domain adaptive hard example mining for fashion Instance retrieva

淘系技术部-多媒体算法-视频内容理解-张爱喜（少麟）

we propose a domain adaptive hard example mining algorithm (DAHEM) for the fashion instance retrieval task.

观看作者解读

Spatial Constrained Memory Network for Semi-supervised Video Object Segmentation

达摩院-视觉技术-图像分析与理解-负天

We propose a Memory Network with spatial constraint and enhanced decoder to tackle the challenge of false predictions and appearance variations in VOS.

观看作者解读

Joint Learned and Traditional Video Compression

达摩院-XG lab-王钊

we propose a joint learned and traditional video compression framework to achieve higher compression efficiency

观看作者解读

Artificial Intelligence Center Spatial Likelihood Voting

达摩院-机器智能技术-付志航

When it comes to weakly-supervised object detection, most methods tend to localize instances to their discriminative parts instead of the whole content. In contrast, we propose a spatial likelihood voting method to converge the proposal localizing process without any bound- ing box annotations.

观看作者解读