下载客户端

KDD2021多个奖项出炉：斯坦福博士摘得学位论文奖，北航校友胡侠获新星奖

2021-08-08 07:59

来源：澎湃新闻·澎湃号·湃客

机器之心报道

机器之心编辑部

在 KDD 2021 线上开幕之前，多个奖项已正式公布。斯坦福博士 Aditya Grover 获得了学位论文奖，北航校友 Xia “Ben” Hu 获得了新星奖，字节跳动 AML 研究团队 Chong Wang 的一篇 KDD 2011 论文获得了时间检验研究奖。

近日，国际数据挖掘顶会 KDD 2021 公布了多个奖项，包括数据科学、机器学习、大数据和人工智能领域的优秀个人和研究团队，其中多位华人学者获奖。

今年的 KDD 大会将于太平洋标准时间 8 月 14 日到 18 日以线上方式召开，议程将包括主题演讲、专题小组、特邀报告、精选研究、workshop 等。

今年的 KDD 大会共计收到 1541 篇有效投稿，其中 238 篇论文被接收，接收率为 15.4%，相比去年的接收率 16.9% 有所下降。

奖项公布详情如下：

创新奖

创新奖是 KDD 大会中颇具分量的奖项，旨在表彰在数据发现和数据挖掘领域做出杰出技术贡献的研究者，这些贡献对促进理论和 / 或商业系统的发展产生了持久的影响。它是数据发现和数据挖掘领域的最高技术奖项，获奖者通常为某一领域的学术领袖。

获得 KDD 2021 创新奖的是微软公司的 Johannes Gehrke 博士，获奖理由为「他在新的数据挖掘算法和数据隐私方面的杰出贡献」。

Johannes Gehrke 是 Redmond 的技术研究员和研究总监，也是智能通信和对话云 (IC3) 的首席技术官和机器学习主管，IC3 为微软团队提供支持。直到 2020 年 6 月，Johannes Gehrke 一直领导 IC3 的架构工作和机器学习工作。他的研究兴趣在数据库系统、分布式系统和机器学习领域，曾获得美国国家科学基金会职业奖、斯隆奖、洪堡研究奖、2011 年 IEEE 计算机协会技术成就奖。

服务奖

SIGKDD 服务奖旨在表彰在数据发现和数据挖掘领域提供杰出服务的个人或团队，包括专业协会和会议的运营、学生和专业人士的教育、资助研发活动等专业服务。

KDD 2021 服务奖的获得者为领英的俞诗鹏博士。俞诗鹏在北京大学取得学士和硕士学位，后在慕尼黑大学获得博士学位。目前，俞诗鹏领导领英的 Communications AI 团队，该团队负责以人工智能引擎推动领英用户参与度的增长和用户留存率。

俞诗鹏曾担任 2017 年 KDD 的总主席，目前是 SIGKDD 的赞助总监，负责监督 KDD 年度会议和其他数据挖掘社区活动的赞助工作。

学位论文奖

ACM SIGKDD 学位论文奖旨在表彰数据科学、机器学习和数据挖掘领域优秀毕业生的杰出工作。

Aditya Grover 是斯坦福大学的博士毕业生（2020 年毕业。他的博士论文《Learning to Represent and Reason Under Limited Supervision》获得 KDD 2021 学位论文奖。

论文地址：https://stacks.stanford.edu/file/druid:jv138zg1058/Thesis-augmented.pdf

自然智能体，例如人类，擅长构建世界的表征并使用它们来有效地进行推理和做出决策。并且即使是在监督非常受限的环境下，人们也能具备这种高级推理能力。与此形成鲜明对比的是，基于机器学习 (ML) 的人工智能的目前最主要的成功是在能够访问大型标记数据集或模拟器的条件下（例如目标识别和游戏）。该论文的研究重点是概率建模框架，旨在缩小自然智能体和人工智能体之间的差距，从而在监督受限的场景中实现有效推理。

该论文由三部分组成。首先，该论文正式为学习概率生成模型奠定了基础。该研究的目标是模拟任何可用数据，从而即使在监督有限的环境中也能提供自然的学习目标。该研究探讨了使用一些模型进行高维学习和推理的各种权衡，包括学习目标的具体选择、优化程序和参数模型族。基于这些见解，研究者提出了新算法来提高 SOTA 模型的性能，并在大型未策划和未标记数据集上进行训练时减少它们的偏置。其次，该研究扩展这些模型来学习关系数据的特征表征。学习这些表征是无监督的，该研究展示了它们在分类和序列决策任务中的效用。最后，该研究展示了这些模型在加速科学发现方面的两个实际应用：

学习压缩感知的数据相关先验；

优化电池充电的实验设计。

该研究使得 ML 系统能够克服现实世界中高维推理和决策问题的关键监督瓶颈。

Aditya Grover 现任 Facebook AI Research 的 Core ML 团队的研究科学家。他还与加州大学伯克利分校的 Pieter Abbeel 合作，担任访问博士后研究员。今年秋季，他将加入加州大学洛杉矶分校，担任计算机科学助理教授。Aditya 的研究围绕机器学习进行概率建模、无监督表示学习和序列决策，并在物理科学和气候变化的交叉点上应用。

学位论文奖亚军

获得学位论文奖亚军的是来自加州大学的 Shweta Jain，获奖论文是《Counting Cliques in Real-World Graphs》。

论文地址：https://escholarship.org/content/qt8m61g6b6/qt8m61g6b6.pdf?t=q9lka1&v=lg

团（clique）是网络科学中的重要结构，已被用于许多应用程序，包括垃圾邮件检测、图形分析、图形建模、社区检测等。由于组合爆炸，在具有数百万个节点和边的图中获取 k-clique 的数量是一个具有挑战性的问题。本质上，随着 k 的增加，k-clique 的数量呈指数增长，并且不知道如何在不枚举的情况下计算它们。大多数现有方法无法计算 k > 5 的 k-clique。

完成全局 k-clique 计数具有挑战性，获取每个边或顶点所属 k-clique 的数量（称为局部 k-clique 计数）更是如此。在该研究中，研究者提出了一组新方法来有效计算大型图中 k-clique 的数量，这些方法在实践和理论上都改进了现有技术。

该研究提出的第一种方法是一种称为 TuránShadow 的随机算法，它使用极值组合学的知识来估计 k ≤ 10 的 k-clique 计数，比 SOTA 方法更快、更准确几个数量级。该研究进一步使用这团的计数机制来计算 near-clique——缺少一些边的团。研究者在一个应用程序中展示了如何超越边并结合高阶结构（如 k-clique）的信息产生比现有方法更具人类可读性的图形可视化。

该研究提出的第二种方法叫 Pivoter，该方法能够对所有 k 值的所有全局和局部 k-clique 进行计数，其时间是所有其他方法（包括并行计算方法和近似方法）所用时间的一小部分。此外，它将 clique 计数的最坏情况运行时间从 O(2n ) 提高到 O(3n/3 )，并证明确实可以在不枚举的情况下对 clique 进行计数。

值得一提的是，该方法使用一种称为 pivoting 的经典方法，大大减少了团的搜索空间。使用该算法，该研究首次实现了获取之前无法进行团计数的几个图的 k-clique 计数。随着数据的增加，挑战也将随之增加。研究者在论文中强调了某些未解决的问题和未来的探索方向，以使团计数在现实世界的大型图形上更易于实现。

Shweta Jain 是伊利诺伊大学厄巴纳 - 香槟分校的博士后研究员，与 Hanghang Tong 教授一起工作。她在加利福尼亚大学圣克鲁兹分校获得了计算机科学博士学位，导师为 Seshadhri Comandur 教授。Shweta Jain 的研究兴趣在于随机化和近似算法、组合优化、图挖掘和海量数据的算法。

荣誉提名

今年的学位论文奖还有一位荣誉提名，来自帕多瓦大学的 Leonardo Pellegrain 获得了这份荣誉，提名论文是《Rigorous and Efficient Algorithms for Significant and Approximate Pattern Mining》。

论文地址：http://www.dei.unipd.it/~pellegri/thesis/leonardo_pellegrina_tesi.pdf

Leonardo 是帕多瓦大学信息工程系的博士后研究员。他的研究致力于为数据中的知识和模式发现提供新颖高效的、统计上可靠的算法。

新星奖

新星奖旨在奖励博士毕业五年内取得突出成果的研究者，今年的获奖者为莱斯大学计算机科学系副教授、北航校友 Xia “Ben” Hu。

Xia “Ben” Hu（胡侠）在北京航空航天大学获得了学士和硕士学位，目前已经在多个顶级学术会议发表了超过 100 篇论文，包括 NeurIPS、ICLR、KDD、WWW、IJCAI、AAAI 等。其团队 AutoKeras 开发的开源软件包已经成为 Github 上使用最多的自动化深度学习系统 (拥有 8000 多星标和 1000 个分支)。此外，他在深度协同过滤、异常检测和知识图表方面的工作分别被收录到 TensorFlow 包、苹果生产系统和必应生产系统中。Xia Hu 的论文获得了 WWW、 WSDM 和 ICDM 等颁发的最佳论文(候选人) 奖，同时他也是美国国家科学基金会职业奖的获得者。

除此之外，KDD 也同时公布了时间检验研究奖（Test of Time Award for Research）和时间检验应用科学奖（Test of Time Award for Applied Science）。

时间检验研究奖

SIGKDD 时间检验奖旨在表彰过去十年对数据挖掘研究社区产生重大影响且目前仍被引作新研究分支基础的 KDD 大会杰出论文。今年的时间检验研究奖颁给了一篇主题为推荐的论文，是 Chong Wang、David M. Blei 合著的《Collaborative topic modeling for recommending scientific articles(KDD 2011)》。

Chong Wang 在普林斯顿大学计算机科学系获得了博士学位，曾在谷歌任职研究科学家。目前，他在字节跳动担任应用机器学习 (AML) 研究团队的负责人，该团队致力于将基础机器学习研究在 Tik Tok、抖音产品中的应用。

时间检验应用科学奖

SIGKDD 时间检验应用科学奖旨在表彰在现实世界应用中产生真正影响的数据科学研究工作。今年的时间检验应用科学奖颁给了谷歌关于实验基础设施设计的一篇经典论文，是 Diane Tang、Ashish Agarwal、Deirdre O’Brien、Mike Meyer 合著的《Overlapping experiment infrastructure: more, better, faster experimentation(KDD 2010)》。