全球疫情严峻,各类赛事、会议能取消则取消,不取消的也纷纷改为线上进行,但学术顶会的步伐却未因此受阻。近日,acm sigkdd 公布了 kdd cup 2020( 国际知识发现和数据挖掘竞赛)的赛事安排。
kdd cup 2020 将延续 2019 年的三个赛道:常规机器学习赛道、自动化机器学习赛道、强化学习赛道,阿里、biendata 分别主办了常规机器学习赛道的赛道一和赛道二,第四范式、滴滴则分别主办了后两个赛道,而第四范式也是连续第二年主办自动化机器学习赛道。所有的比赛都将在 3 月-4 月进行,奖金池更是达到了 12 万美金。
本次 kdd cup 主席团中也有着两张华人面孔:清华计算机系教授唐杰和滴滴技术副总裁叶杰平。唐杰曾任 kdd 2018 大会副主席,并获得当年的杰出贡献奖;叶杰平则从 2005 开始便成为 kdd 的常客,并在 2013 年获得 kdd 最佳论文奖,而其和学生在 kdd 中过的论文总数超过 60 篇。
同时,acm sigkdd 和 kdd 2020 组委会也表示,将以参会者和志愿者的健康、安全为首要考虑,在现行惯例之外,采取有效措施,根据疫情变化,探索可用方案,以保证赛事的有序进行。
kdd cup 2020 赛项
• 常规机器学习赛道(ml 赛道 1) 「现代电子商务平台挑战赛」(于 2020 年 3 月 30 日开放)
• 常规机器学习赛道(ml 赛道 2) 「图片对抗性攻防」(于 2020 年 4 月 15 日开放)
• 自动化机器学习赛道(automl 赛道) 「用于图表示学习的 automl」(于 2020 年 3 月 30 日开放)
• 强化学习竞赛赛道(rl 赛道) 「学习按需移动平台上的调度和重定位」(2020 年 4 月 2 日开放)
常规机器学习赛道(ml 赛道 1)
赛道关键字:学习表示,迁移学习,图像、视频和文本处理
平台:天池
总奖金: 40,000 美元
报名时间:utc 2020 年 3 月 30 日至 2020 年 4 月 27 日。utc 2020 年 4 月 27 日晚上 11:59 将关闭报名入口,并禁止换队。
任务及评审标准:ml track 1「现代电子商务平台挑战」赛项,要求参赛者通过考虑不同类型的复杂信息和模式之间的紧密联系,学习高质量的跨模式表达;然后,学习表示可用于计算表示之间的相似度得分,并选择与文本相关的图像/视频;最后,每一次提交都将在测试数据集上进行评估,该数据集评估检索到的产品与事实之间的对应关系。
此赛项有两个分任务,任务 1 主题为「召回多模式实体」。
参赛者需要设计一个模型框架,以促进对图像和视频的有效语义理解、搜索和检索,以便召回具有适当多模态内容的产品并对其进行排名,从而帮助消费者做出更好的决策。
召回多模式实体赛项详情:
https://tianchi.aliyun.com/competition/entrance/231786/introduction?spm=5176.12281949.1003.4.2926539dvvsnc8
任务 2 主题为「消除偏见」。
由于指定目标(例如 ctr,cvr 或 gmv)带来的算法偏见,将导致机器学习推荐系统产生严重的马太效应,用户将搜到曝光率更高的商品,从而导致推荐的不公平。因此,了解系统是否公平是至关重要的,也即「消除偏见」。
消除偏见赛项详情:
https://tianchi.aliyun.com/competition/entrance/231785/introduction?spm=5176.12281949.1003.5.2926539dvvsnc8
常规机器学习赛道(ml 赛道 2)
赛项关键词:生成对抗网络(gan),图结构数据,图嵌入
总奖金: 19,000 美元
平台: biendata
任务及评审标准:ml 赛道 2 「图片对抗性攻防」赛项分为两个阶段。
在第一阶段,将为所有团队提供一个图形数据集,然后要求参赛者以作为一种攻击形式,提交该数据集的修改版本,修改后的数据看起来应与原始图「相似」,但在竞赛系统后端准备并保存的基准模型下分类精度较低。
在第二阶段中,所有团队都必须提交攻击模型和防御模型,塞方将发布相似但不相同的图形数据集。攻击模型是一种算法,可以读取图形和防御模型,并根据这两个输入来修改图形。防御模型是对图进行稳健分类的模型。
评审标准:然后赛方将匹配所有团队的所有进攻模型和防守模型。在每次比赛中,攻击模型将首先修改图,而防御模型则将修改后的图分类,比赛系统将记录每次比赛的准确性。最后,每支球队都会获得两个模型的准确性报告,然后以此作为排名依据。
ml 赛项 2 详情地址:
https://biendata.com/competition/kddcup_2020/
自动化机器学习赛道(automl 赛道)
赛项关键字:图表示学习,图结构化数据,图嵌入,automl
总奖金: 33,500 美元
平台: codalab
任务及评审标准:automl 轨道「用于图表示学习的 automl」是有史以来第一个应用于图结构数据的 automl 挑战。
在这一挑战中,参赛者被要求搭建用于图表示学习的 automl 亚博电竞网的解决方案,以自主地绘制图形表示学习问题(无需任何人工干预),其中节点选择分类作为评估学习表示质量的任务。
每个团队都有三个公共数据集来开发 automl 亚博电竞网的解决方案,并提供六个反馈数据集,以使参与者能够评估他们的亚博电竞网的解决方案。这些亚博电竞网的解决方案将在没有人工干预的情况下使用六个看不见的数据集进行评估,优胜者将根据数据集的最终排名进行选择。
automl 赛项详情地址:
https://www.automl.ai/competitions/3
强化学习比赛赛道(rl 赛道)
赛道关键字:强化学习,按需机动性,车辆重定位
总奖金: 30,000 美元
平台: codalab
任务及评审标准:rl 轨道「学习按需移动平台上的调度和重定位」赛项要求:参与者应用机器学习工具来确定新颖的亚博电竞网的解决方案,重点考察点为如何应用机器学习亚博电竞网的解决方案来提高 mod 平台的效率。
其中包含了 2 个任务,即按需移动(mod)平台上的订单分派(订单匹配)和车辆重定位(车队管理)。
任务 1 订单分派要求团队开发一种算法,实现在两秒钟的调度窗口内确定订单驱动程序分配。其中,未完成的订单(行程请求)和可用的驱动程序需要在窗口中进行批处理,它们的状态信息将传递到订单调度算法中。
在整个模拟中,将为每个调度窗口重复调用此模块。评估模拟将运行多天,从中计算出平均驾驶员总收入,以此作为算法的得分。
任务 2 车辆重新定位要求团队为预选的小型车辆开发一种重新定位算法。对于这些车辆中的任何一个,如果连续怠速时间超过 l = 5 分钟的阈值,则该车辆可以重新定位。
环境会定期将所选组中所有合格车辆的状态信息发送到重新定位算法,该算法指示驾驶员驶向特定目的地。模拟期间,参赛算法的平均个人收入率,被计算为该算法的分数。
这些算法将在团队无法访问的模拟环境中进行评估,除了环境所产生的分数之外。参与团队可以选择开发一种或两种算法。
rl 赛道详情地址:
https://outreach.didichuxing.com/competition/kddcup2020/
kdd cup:数据挖掘的世界杯
kdd cup 由美国计算机协会知识发现与数据挖掘专委会(acm sigkdd)发起,被称为数据挖掘的世界杯,是该领域水平最高、影响力最大的顶级赛事。该比赛同时面向企业界和学术界,从 1997 年开始,每年举办一次,吸引了世界数据挖掘界的顶尖专家、学者、工程师前来参赛。
此外,kdd cup 可以说是华人的主场。
2005 年杨强(右二) kdd cup 夺冠照片
最早,2004、2005年,香港科技大学教授、ieee fellow 杨强曾带领其团队连续两年拿下 kdd cup 比赛冠军。到了 2017 年,中国队伍几乎包揽了 kdd cup 的所有奖项。
kdd cup 强调应用,前期的承办者多为高校,近十年则越来越多由企业赞助。与此同时,中国企业的出镜率也越来越高。kdd cup 2017 便曾由阿里云承办,百度、第四范式也赢得过 kdd cup 2019 的主办权。
2019 年,kdd cup 有了独立的议程,并首次设立 3 个赛道:regular ml(常规机器学习)、auto-ml(自动化机器学习)、humanity rl(强化学习),其中强化学习的赛道为首次设立。三个赛道的冠军分别被蚂蚁金服和日本的 ntt docomo 公司、深兰科技和北京大学团队、国立成功大学拿下。
雷锋网.雷锋网.雷锋网