Giter Club home page Giter Club logo

competition-baseline's Introduction

数据竞赛Baseline & Topline分享

假如你是数据竞赛的初学者、爱好者,比赛的baseline不仅是比赛思路分享,同时也是一类数据问题的方法总结。本Repo想做的就是将收集并整理并分享各种比赛的baseline方案。

你可能会问为什么是baseline,而不是获胜者的代码分享?相比于获胜者的代码baseline代码都比较简单,容易整理和学习;其次baseline代码更加实用和简洁,适合入门学习。

数据竞赛

竞赛日历:http://coggle.club/

最新的竞赛信息和baseline推送,请关注:

竞赛分享

每个比赛的详细分享请见competition文件夹

如果本仓库访问速度慢,可以访问国内备份:https://gitee.com/coggle/competition-baseline


2024数字**创新大赛DCIC-海上风电出力预测

本赛题要求选手基于风力海况气象数据、风机性能数据等,针对复杂多变气象和海况条件的深度耦合影响,提出海上风电出力预测模型,提升模型精度以及在工程应用中的可信度,为大规模风电接入下的能源安全可靠运行提供保障。

赛题报名链接:https://www.dcic-china.com/competitions/10098


2023科大讯飞AI开发者大赛

2023科大讯飞AI开发者大赛正式启动,现开始报名。本次大赛在“36道应用赛+72道算法赛”的基础上,还开设了高校认知大模型场景创新赛和机器人设计赛,覆盖大模型、智能语音、计算机视觉、自然语言、先进智造、VR等人工智能热门技术,涵盖多行业领域,总奖金池累计超400万。

赛题报名链接:https://challenge.xfyun.cn/?ch=vWxQGFU


2022年人民网算法挑战赛

为推进人工智能领域的学术交流、人才培养、技术发展,鼓励广大学生积极学习和研发符合我国主流价值观的优秀算法, 2022年11-12月举办“2022人民网人工智能算法大赛”,赛事由人民网股份有限公司主办,传播内容认知全国重点实验室承办。

http://data.sklccc.com/2022


2022年度 iFLYTEK A.I. 开发者大赛

2022年度 iFLYTEK A.I. 开发者大赛来了。本届大赛的总奖金池已升级到了超420万元,除此外还将进一步开放海量数据与核心技术,汇聚更多人工智能开发者,提供创孵平台,培育优质团队,给予扶持政策等。

本届大赛按照算法、应用、编程赛、虚拟形象选拔、辩论赛、创意集市创意赛等等方向设置众多赛道;覆盖了智能语音、视觉、自然语言、图文识别等AI热门技术;涵盖了元宇宙、遗址文化、生物与环保、医疗健康、智能家居、电商销售等众多领域。大赛地址:https://challenge.xfyun.cn/?ch=ds22-dw-sq04


AIWIN 秋季竞赛

  • 赛题1- 手写体 OCR 识别竞赛

手写体 OCR 识别竞赛由交通银行命题,设立两个任务,其中任务一由第四范式提供开放数据集,特别针对金额和日期做识别,任务二要求在指定训练环境完成不可下载训练集的训练,增加了银行机构的文本内容。任务一适合新手,并配套学习营和特别的学习奖励。

比赛地址:http://ailab.aiwin.org.cn/competitions/65

baseline地址:https://aistudio.baidu.com/aistudio/projectdetail/2612313

  • 赛题2- 心电图智能诊断竞赛

心电图智能诊断竞赛由数创医疗和复旦大学附属中山医院共同命题,设立两个任务,其中任务一诊断心电图的正常异常与否,任务二对10+种不同症状予以判断综合分类。任务一同步设有学习营和配套的学习奖励,欢迎新手参与。

比赛地址:http://ailab.aiwin.org.cn/competitions/64

baseline地址:https://aistudio.baidu.com/aistudio/projectdetail/2653802


2021阿里云供应链大赛——需求预测及单级库存优化

报名链接:https://tianchi.aliyun.com/competition/entrance/531934/introduction

比赛baseline:https://github.com/datawhalechina/competition-baseline/tree/master/competition/2021阿里云供应链大赛——需求预测及单级库存优化


CCF BDCI 2021

baseline汇总:https://github.com/datawhalechina/competition-baseline/tree/master/competition/DataFountain-CCFBDI-2021

  • 基于飞桨实现花样滑冰选手骨骼点动作识别,计算机视觉、姿态估计
  • 千言-问题匹配鲁棒性评测,自然语言处理、文本匹配
  • 基于MindSpore AI框架实现零售商品识别,计算机视觉、图像分类
  • 产品评论观点提取,自然语言处理、实体抽取
  • 个贷违约预测,结构化数据挖掘、金融风控
  • 剧本角色情感识别,自然语言处理、实体抽取
  • 基于UEBA的用户上网异常行为分析,结构化数据挖掘、异常检测
  • POI名称生成,计算机视觉、OCR
  • 客服通话文本摘要提取,自然语言处理、文本摘要
  • 系统认证风险预测,结构化数据挖掘、风险检测
  • 泛在感知数据关联融合计算,结构化数据挖掘、相似度计算
  • openLooKeng跨域数据分析性能提升,数据仓储SQL优化
  • 大规模金融仿真图数据中金融交易环路查询的设计与性能优化,金融交易图谱挖掘
  • 基于BERT的大模型容量挑战赛,深度学习模型优化

华为DIGIX2021:全球校园AI算法精英大赛

报名链接:https://developer.huawei.com/consumer/cn/activity/digixActivity/digixdetail/201621215957378831?ha_source=gb_sf&ha_sourceId=89000073

  • 赛题1:基于多目标多视图的用户留存周期预测
  • 赛题2:基于多模型迁移预训练文章质量判别
  • 赛题3:基于多目标优化的视频推荐
  • 赛题4:基于多模态多语言的搜索排序
  • 赛题5:小样本菜单识别

比赛baseline和学习资料:https://github.com/datawhalechina/competition-baseline/tree/master/competition/DIGIX2021


科大讯飞AI开发者大赛2021


2021年度腾讯赛

本届从广告应用场景痛点出发,开设“视频广告秒级语义解析”和“多模态视频广告标签”两大赛道,兼具算法挑战性和商业应用价值。

2020年度腾讯赛

本届以用户在广告系统中的交互行为作为输入来预测用户的人口统计学属性。







结构化比赛


CV类型比赛


NLP类型比赛


其他类型

其他链接:

贡献者(按照贡献ID排序)

协作规范

欢迎大家fork并贡献代码,但请大家遵守以下规范和建议:

  1. 代码请按照比赛的形式进行整理,写明比赛的网址、数据类型和解题赛题;

  2. 代码请注明运行的环境,以及机器最低配置,如:

    • 操作系统:Linux,内存16G,硬盘无要求;
    • Python环境:Python2/3
    • Pytorch版本:0.4.0
  3. baseline代码只能提供可运行的代码和思路,请不要提供直接可以提交的结果文件;

  4. 代码提供者应对代码版权和共享权负责;

  5. 如果发现Repo存在版权等相关问题,请邮件联系[email protected]

关注我们

Datawhale是一个专注AI领域的开源组织,以“for the learner,和学习者一起成长”为愿景,构建对学习者最有价值的开源学习社区。关注我们,一起学习成长。

LICENSE

GNU General Public License v3.0

Star History

Star History Chart

competition-baseline's People

Contributors

anine09 avatar bettenw avatar finlay-liu avatar sm1les avatar turkeymz avatar yinpub avatar yphacker avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

competition-baseline's Issues

关于提交代码里的学习率

按文档说明,最后提交的结果用的是学习率0.01来训练的,可是代码里貌似用的是0.4,中间是有什么遗漏吗?

文件问题

请问baseline中读取的sample_submit.csv文件在哪呢

电商搜索算法赛代码提问

请问给出的sentence-bert训练集构造代码中 “if idx-1 in train_neg_piar:” 的意义是什么呢?看起来整个集合中该if判断都是false

脑PET图像分析baseline

感谢分享,有两个问题想交流下:

1.视频中说这个baseline能跑到0.81分,但是实测只有0.75;
2.视频中说小数据用小模型防止过拟合,baseline用的是resnet34,但是我实测同样的设置,模型越大线上效果越好,比如resnet34 线上0.75,efficientnetb1 线上0.76, b4 0.78, b5 0.80.

Cry_baseline FileNotFoundError: [Errno 2] No such file or directory: 'hug.npy'

OS, Colab
I copied the code block, this error occurs.
Besides, I have questions about data path. Data path for train is ''../input/train/'', and for test is ''../input/test', why does train have the ending slash while test doesn't? thx for your help.

['hug', 'awake', 'hungry', 'diaper', 'uncomfortable', 'sleepy']

FileNotFoundError Traceback (most recent call last)
in ()
11 # save_data_to_array_test()
12
---> 13 X, y = get_train_test()
14 skf = StratifiedKFold(n_splits=5)
15

1 frames
in get_train_test(split_ratio, random_state)
53
54
---> 55 X = np.load(labels[0] + '.npy')
56 y = np.zeros(X.shape[0])
57

/usr/local/lib/python3.6/dist-packages/numpy/lib/npyio.py in load(file, mmap_mode, allow_pickle, fix_imports, encoding)
426 own_fid = False
427 else:
--> 428 fid = open(os_fspath(file), "rb")
429 own_fid = True
430

FileNotFoundError: [Errno 2] No such file or directory: 'hug.npy'

baseline十分敷衍

为啥感觉一些比赛的baseline是越来越敷衍了,甚至说连规则都不算。。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.