第十届CCF大数据与计算智能大赛正在报名中
发布人:fanh 发布时间:2022/9/22 16:49:51  浏览次数:2337次
【字体: 字体颜色

CCF大数据与计算智能大赛(CCF BDCI)由CCF于2013年创办,是大数据与人工智能领域的算法、应用和系统大型挑战赛事 迄今已成功举办九届

第十届CCF大数据与计算智能大赛已正式开赛!2022年第十届CCF BDCI将进一步关注数字经济技术发展与人才培养,助力推动我国大数据技术及产业生态发展。大赛从百度、华为、360等10余家知名企业和科研院所征集大规模数据与真实场景,形成了涉及图像识别、自然语言处理、数据挖掘、系统优化等不同技术方向的20余道赛题,通过在线排行榜自动评测与院士专家评审结合的方式选拔优秀团队。


赛道赛题

赛题

赛题任务

【算法赛道】 精通各类算法,热爱编程?快来【算法赛道】与数据科学爱好者“码”上PK!

基于文心CV大模型的智慧城市视觉多任务识别

选手需使用飞桨(PaddlePaddle)深度学习框架,基于人脸、人体、车辆、商品四大场景任务,训练视觉大一统模型。

系统访问风险识别

基于用户历史的系统访问日志及是否存在风险标记等数据,结合行业知识,构建必要的特征工程,建立机器学习、人工智能或数据挖掘模型,并用该模型预测将来的系统访问是否存在风险。

高端装备制造知识图谱自动化构建技术评测任务

通过从大量故障案例文本抽取出部件单元、性能表征、故障状态、检测工具等实体及其关系,为后续高端装备制造业故障知识图谱构建和故障智能检修和实时诊断打下坚实基础。

返乡发展人群预测

基于中国联通的大数据能力,通过使用对联通的信令数据、通话数据、互联网行为等数据进行建模,对个人是否会返乡工作进行判断。

小样本数据分类任务

智慧芽构建了一种新的分类体系,并提供958条训练数据,及对应36个类别的分类标签,要求选手设计一套算法,完成测试专利数据的分类任务。

【自主平台赛道】 热衷于研究算法,喜欢钻研?快来【自主平台赛道】畅快体验!

基于文心NLP大模型的阅读理解可解释评测

需使用飞桨(PaddlePaddle)深度学习框架,根据给定的一段文本T及与其相关的问题Q,从文本T中抽取问题Q对应的的答案,同时给出模型预测答案所依赖的证据。

基于昇思MindSpore AI框架的肾脏肿瘤分割

利用赛方所提供数据,分析数据特点,在华为昇思MindSpore AI框架上设计、开发可用于肾脏和肾脏肿瘤语义分割的算法模型。

基于TPU平台实现人群密度估计

选用预训练的模型部署在算能TPU芯片上,无需自己训练模型;在实现模型部署的过程中,参赛者需兼顾精度与推理速度。

【系统赛道】 逻辑思维极强,善于构建方案?快来【系统赛道】提升系统优化能力!

SQL语句内存使用量预测系统

只涉及SQL语句内存使用量预测系统,重点在于根据SQL涉及的算子、表格数据量和参与计算的列等信息,建立一个内存使用量预测系统。

数据湖流批一体性能优化

可以选择一个数据湖存储框架,在保证数据正确性的前提下,通过调优参数、优化代码的方式来优化性能,提升写入速度。

大规模金融图数据中异常风险行为模式挖掘

使用简化的金融仿真数据,数据为带有时间戳和金额的账户间交易、转账等数据。基于此数据自动挖掘出不小于频繁度(f >= 10000)的频繁子图模式集合。

【数字安全专题赛】 担忧大安全隐患,想保卫数字安全?快来“战”出数字安全最优解!

Linux跨平台二进制函数识别

需要先根据训练集中的样本数据自主设计算法模型,然后再对测试集中的函数进行相似匹配识别,从而尽可能多地找出与指定函数相似的其他平台下的函数。

基于人工智能的漏洞数据分类

平台将提供数据分类规则和具体内容,参赛选手需通过平台给出的已标注数据、未标注的漏洞数据,设计软件算法模型并不断完善模型对于分析数据结果的正确率。

大数据平台安全事件检测与分类识别

根据赛题提供的无标签大数据平台日志数据,参赛队利用机器学习、深度学习,UEBA等人工智能方法,构建系统用户使用大数据平台的行为基线和数据安全事件识别及分类模型。

Web攻击检测与分类识别

需要对前期提供的训练集进行分析,通过特征工程、机器学习和深度学习等方法构建AI模型,实现对每一条样本正确且快速分类,不断提高模型精确率和召回率。

【训练赛道 没有竞赛经验,但跃跃欲试?快来【训练赛道】开启你的第一场竞赛!

openEuler社区视频会议纪要自动生成

开发可以在openEuler 22.03 LTS上独立部署的视频处理软件,通过CLI或API对指定的openEuler SIG组会议视频录像进行处理,对视频内容自动生成文字版会议纪要,并输出到指定位置。

基于openGauss的自然语言查询器

将用户输入的自然语言文本,基于机器学习和AI算法识别,经过NLP分析处理后,转换生成对应的SQL语句。生成的SQL能够实现用户的需求并可以在openGauss数据库成功执行。

带噪音的社交网络对齐

依据Arenas的Email网络数据,利用机器学习、深度学习等相关技术,建立一个在噪音存在情况下能准确对齐网络实体的模型,从而分析并挖掘网络中用户的对齐关系。

电磁信号调制方式识别

通过软件无线电平台(GNU Radio)采集在不同信噪比下不同调制方式信号的IQ数据,利用深度学习等相关技术,建立稳健的信号调制方式识别模型,识别出未知信号的调制方式种类。

跨域评分预测

依据源域和目标域的用户和商品的交互信息,利用机器学习、深度学习等相关技术,建立有效的跨域推荐模型,使得模型能有效地迁移用户在源域中的知识,进而能准确预测用户对给定目标域商品的评分。

模心智创-文心大模型智能创意赛

选手可在文心大模型API开放平台中使用不限于文生图、Text2SQL、作文创作、文案创作、摘要生成、问题生成、古诗创作、对联续写、小说续写、自由问答、信息抽取、同义改写、文本匹配、文本纠错、完形填空等文心大模型API进行参赛。


大赛赛程

2022.8.29-

2022.9.5-11.7

2022.11.9

2022.11.26-11.27

2022.12月中旬

赛题发布,开放报名

初赛A榜阶段

初赛B榜阶段

决赛答辩评审

决赛 线下

*各赛题赛程设置略有不同,以各赛题详情页面内容为准。

大赛奖项

单赛题奖励 单赛题一二三等共五支团队,各获奖团队队员均可获得奖金、证书、面试绿色通道等奖励; 参与任意赛题并获得排行榜成绩,即可获得电子证书。

CCF BDCI综合奖励  综合特等奖一名、最佳单项奖三名,参赛团队队员均可获得奖金、证书及相关荣誉。

参赛特别礼品  参赛过程中将根据参赛团队周榜、邀请等活动可获得特别奖项。

就业与孵化机会 

绿色通道:优秀团队可获得相关赛题出题单位实习、就职绿色通道;

创业孵化:优秀团队可获得由政府、投资机构投提供的融资、孵化支持;

落地应用:优秀团队可获得由大赛各合作单位提供的项目成果应用、试点机会。

优秀指导老师  各赛题一等奖指导老师,及对大赛辅导、宣传、组织提供重要支持的老师可获得。

特别贡献者  在大赛组织工作中做出突出贡献的个人或单位可获得。

优秀合作伙伴  对大赛组织做出重要支持的合作单位可获得。


大赛面向社会各界开放,不限年龄、国籍,高校、科研院所、企业从业人员均可登录大赛官方平台DataFountain官网(datafountain.cn)报名参赛。


详见:中国计算机学会官网https://www.ccf.org.cn/Focus/2022-09-21/774123.shtml)