Giter Club home page Giter Club logo

iaa_tutorial's Introduction

北京邮电大学图像美学评估课题组

最新动态

  • 2024年7月16日,实验室一篇图像美学评估论文,被多媒体顶会ACMMM2024录用;
  • 2024年6月7日,实验室公费组织同学去北京野生动物园团建;
  • 2024年5月2日,课题组美学一篇论文被机器学习顶会ICML录用;
  • 2024年4月17日,课题组计算摄影+美学两篇论文被人工智能顶会IJCAI录用;
  • 2024年3月25日,课题组在CVPR NTIRE AIGC质量评估赛道1获得冠军,赛道2获得第5,在VQA赛道获得第9;
  • 2024年3月12日,课题组受邀参观正印公司;
  • 2023年9月21日,课题组参加研鼎图像质量评估交流会;
  • 2023年7月26日,实验室一篇图像美学评估论文,被多媒体顶会ACMMM2023录用;
  • 2023年7月20日,实验室一篇ITU国际标准通过for consent;
  • 2023年7月14日,实验室一篇图像色彩评估论文,被计算机视觉顶会ICCV录用;
  • 2023年6月1日,实验室公费组织同学去环球影城游玩;

课题介绍

课题简介

课题组成员

目前在读学生为27人,构成比例为9本科生(包含准研究生)+15研究生+3博士生

最新成果

  • "ELTA: An Enhancer against Long-Tail for Aesthetics-oriented Models.", ICML 2024, 机器学习顶会.
  • "M2Beats: When Motion Meets Beats in Short-form Videos.", IJCAI 2024, 人工智能领域顶会.
  • "AK4Prompts: Automatically Keywords-Ranking Guided by Aesthetics for Prompts in Text-To-Image Models.", IJCAI 2024, 人工智能领域顶会.
  • "EAT: An Enhancer for Aesthetics-Oriented Transformers.", [pdf] [code] ACMMM2023, 多媒体顶会.
  • "Metadata for image aesthetics assessment with aesthetic attributes in mobile terminal computational photography system.", ITU国际标准, 国际三大标准组织之一.
  • "Thinking Image Color Aesthetics Assessment: Models, Datasets and Benchmarks.", [pdf] [code] ICCV2023, 计算机视觉领域顶会.
  • "Rethinking Image Aesthetics Assessment: Models, Datasets and Benchmarks.", [pdf] [code] IJCAI 2022, 人工智能领域顶会.
  • 若干在投

入门学习(正式加入课题组后,会有更完整的学习资料)

1. 学习路线

  • 前一两个月,阅读一些关于图像美学评估和图像质量评估方面的论文或博客,了解图像美学评估是什么,并会给你初拟一个方向,你带着问题看文献。另外python和Pytorch没有基础的同学,需要在这段时间补一些基础;
  • 第三个月之后,重点看一些有开源代码的文章,尝试跑一跑代码;
  • 在代码玩的比较熟后,可以尝试结合研究方向,魔改代码,找到创新点;
  • 实验结果符合预期,开始参与论文写作,或负责论文写作。(组内几位本科实习的同学,平均会在6个月左右,开始有成果产出)

2. 文献阅读

  • "绘画艺术图像的计算美学." pdf [link]
  • "图像美学质量评价调研报告." 知乎 [link]
  • "这些年,计算机美学的发展." 知乎 [link]
  • Naila Murray, Luca Marchesotti, Florent Perronnin: "AVA: A large-scale database for aesthetic visual analysis." CVPR (2012) [pdf]
  • Hossein Talebi and Peyman Milanfar: "NIMA: Neural image assessment." TIP (2018) [pdf] [code]
  • Aydın, Tunç Ozan, Aljoscha Smolic, and Markus Gross: "Automated aesthetic analysis of photographic images." IEEE T VIS COMPUT GR (2014) [pdf].

3. 理论基础

  • 哔哩哔哩搜索:"李宏毅最新机器学习课程." ❗只需看完线性回归,逻辑回归,梯度下降,卷积神经网络,Pytorch Tutorial,Attention和Transformer即可❗

4. 动手实践

  • "动手学深度学习(PyTorch版)." GitHub [link] ❗只需看完第1, 2, 3, 4, 5, 7.1, 7.2, 7.3, 7.4, 7.5, 7.8, 9.1, 9.2, 9.12, 9.13, 10.11即可❗
  • "深度学习框架PyTorch:入门与实践." GitHub [link] ❗可选学习内容❗

学习工具推荐

  • "Zotero." 论文整理工具 [link],推荐安装[Zotero GPT插件]
  • "connectedpapers." 论文追溯工具 [link]
  • "Paperswithcode." 论文代码查找工具 [link]
  • "Google colab." 免费线上GPU平台,如额外需要线下服务器资源,请联系我本人 [link]

组会安排

  • 小组会:一般在每周末9:00附近,线上会议,无老师,所有组内同学参加,博士师兄和师姐带队,主要分享上一周科研进度和论文阅读情况,至多准备两三页的PPT即可(可选)
  • 大组会:一般在周五9:00附近,线上会议,实验室所有老师和同学参加,安排组内一位同学,汇报当前的科研进度,大概10页以上PPT,老师提出指导意见。一般每个同学最多一个半月轮到一次,基本无压力。PPT格式请参考[链接]
  • 组内同学学习时间要求:周一至周五白天,9:00-11:30,2:30-5:30,周日至周四晚上,7:30-10:00,该时间为组内成员正常在实验室学习时间,其余时间不做要求

常见问题答疑

  • 如何进入实验室实习或攻读硕士学位?请首先与实验室导师取得联系。在经由导师或博士生的面试并达成共同意向后,你即可开始实习。

  • 实习期间对我有何要求?你应具备良好的英文文献阅读能力,熟悉深度学习相关框架,并至少承诺6个月的实习期。在实习期间,请保持与实验室的密切沟通,确保及时响应。

  • 面试时我需做哪些准备?面试将在线进行,请准备一份PPT,内容至少包括你的科研经历、项目经历及未来规划。

  • 实验室是否需打卡?实验室无需打卡,但请在以下时段保持在线:周一至周五 9:00-11:30,2:30-5:30;及周日至周四晚上 7:30-10:00。

  • 实验室的研究生可否寻找工作实习?可以。一般在研究生二年级的暑假期间,学生会获得实习机会。但请确保实习前你的科研有所进展,以避免影响开题进程。

  • 我是本科生,实习于实验室能带给我什么?你有机会参与顶级学术会议(目前三位实习的本科生已因参与顶会研究而获得直博或研究生资格),参与项目(有兴趣的同学会有机会跟进组内的计算机视觉项目并获得报酬),获得名额推荐及留在实验室继续深造。

  • 实验室硕士生的毕业要求及导师是否会因特定原因延迟学生毕业?我们通常不会延迟学生的毕业。学术硕士的毕业要求是有一篇顶级会议或期刊的研究成果。若未被接受,也须确保你的研究付出与顶级论文相当。专业硕士的论文要求较为宽松,无特殊要求。至今为止,组内同学均正常毕业。

  • 实验室学术硕士和专业硕士之间的差异是什么?学术硕士毕业需要满足学校层面的论文发表要求,而专业硕士则没有此要求。两者在其他方面并无明显区别。

  • 实验室毕业的硕士都选择了哪些发展路径?我们有同学选择到清华大学、北京大学等知名高校继续深造,也有同学加入BAT等顶级企业,以及国家安全局等国有企业。

  • 我能否获得导师的直接指导?当然可以。导师及博士生会为你提供研究写作及方向上的亲自指导。

  • 保研成功后,复试面试是如何进行的?复试面试主要是形式化的程序,即使你在面试中回答得不够完美也不会受到影响。面试一般包括:英文自我介绍、阅读英文文章并翻译、政治题及简历相关提问以及几个专业问题。

  • 实验室重视哪些学生特质?如何赢得导师的好感?我们高度重视学生的积极性。出勤率是一个直接的指标,它可以反映学生的投入程度。经验表明,产出优秀研究成果的学生往往是那些经常待在实验室的。

  • 实验室的奖学金评定标准是什么?每年的学业奖学金由实验室内部老师评定,我们主要依据你的日常科研、项目参与和出勤情况来评定,而不是课程成绩。如若你有一篇顶级会议或期刊论文,你将有资格被推荐为国家奖学金候选人。

  • 实验室在哪? 北京邮电大学本部,新科研楼801和806。

Real.time.IAA.inference.video.for.M+MNet.1.mp4
Real.time.IAA.inference.video.for.M+MNet.2.mp4

iaa_tutorial's People

Contributors

woshidandan avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar

iaa_tutorial's Issues

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.