没有导师指导,该如何自己选题发CVPR?

| 背景

底层计算机视觉技术,如图像增强、图像复原等,一直以来都是一个重要且热门的研究方向。传统的方法多基于稀疏编码、小波变换等技术,近年来,深度学习的兴起为该领域带来了新的发展机遇,同时大幅度提升了方法性能。然而,与工业界源源不断的增强、复原需求相比,现有方法在稳定性、视觉效果、处理速度等方面仍有比较大的提升空间。因此,学术界多数研究组均设有底层视觉相关研究方向,每年均有大量的顶会论文发表。该领域未来的研究及工程落地将继续活跃,借助硬件设备日益增长的计算能力,持续提升方法的稳定性、视觉效果等。

基于深度学习的底层视觉技术无论在理论上还是实践上都有重要意义。首先,理论上,底层视觉对应了所有的图像到图像的处理问题,相比高层视觉任务如图像分类等,底层视觉任务需要求解的解空间更大。其次,在实践上,底层视觉技术已经被应用到日常生活及工业生产的方方面面。以图像超分辨率为例,随着目前手机、电视等显示屏分辨率的提升,高质量视频、图像可以极大提升用户体验。然而,很多存量的经典影视剧受限于拍摄时的技术限制,分辨率相对较低。因此,使用图像超分辨率技术将经典影视剧超分到较高分辨率对各电视台、网络媒体及手机、电视厂商来说都有重大需求。底层视觉技术已经应用到生活生产的方方面面,包括但不限于遥感、医疗图像处理、摄像设备、手机、电视、压缩传输等,有着极大的应用价值。

以基于深度学习的底层视觉技术为例,深入讲解算法知识及方法综述,并基于此讲解研究计划的撰写方法。项目涉及的底层视觉处理前沿技术可以解决生活、工业生产、军工等领域常遇到的低质图像复原或增强问题,同时本项目讲解的研究计划撰写技巧可以直接帮助到同学们进行硕士和博士申请。

1、课程导师

  导师介绍:梁博士

先后于CVPR、ICCV、ECCV、AAAI等国际顶级会议,以及TPAMI、TIP等国际顶级期刊上发表论文13篇

常年担任CVPR、ICCV、ECCV、TIP等国际顶级会议及期刊的审稿人,每年审稿十余篇

曾获CVPR杰出审稿人奖项

拥有丰富的与国内外知名导师合作的经验,对学术前沿及导师招生逻辑有较深的理解

研究领域:基于深度学习的底层计算机视觉任务,包括但不限于图像增强、图像复原等

2、科研课题

课题一:基于自适应实例归一化的先验图像复原技术探究(Image Restoration with deep priors based on Adaptive Instance Normalization)

期待结果:

1、充分理解图像复原研究领域的相关工作发展脉络,能够对现有方法的优缺点进行总结

2、调研学习多种图像归一化策略,思考其在图像复原方向的应用场景

3、在课程期间,思考图像复原任务中可以应用的先验信息,同时思考如何使用自适应实例归一化策略通过相应先验信息对复原网络进行正则化约束

4、撰写相应的研究计划

课题二:基于对比学习的深度无监督图像超分技术探究(Deep Unsupervised Image Super-Resolution based on Contrastive Learning)

期待结果:

1、调研总结基于深度学习的图像超分相关论文并进行总结

2、理解真实图像超分与仿真图像超分之间的联系与区别,并思考真实图像超分面临的技术难点

3、调研对比学习等深度无监督学习任务,思考其与真实图像超分工作的联系进行正则化约束

4、撰写相应的研究计划

课题三:人类视觉感知特性引导的图像相似度评价指标研究(Image Similarity Metrics Guided by Human Perceptions)

期待结果:

1、通过观察课堂提供的样例,了解目前图像复原、增强方法结果的问题

2、通过对比图像视觉效果与现有评价指标,了解当前指标存在的问题

3、调研图像质量评价、相似度评价等相关文章,设计基于深度学习的更符合人类视觉特性的图像相似度评价指标

4、撰写相应的研究计划

课题四:基于模型蒸馏的高效图像复原及增强方法研究(Efficient Image Restoration and Enhancement based on Model Distillation)

期待结果:

1、充分调研当前图像复原、增强等底层视觉方法的运行速度及复杂度,并进行总结

2、在课堂上学习工业界真实的图像增强、复原任务需求,理解当前方法的速度短板,明确高效方法研究的重要性

3、调研思考模型蒸馏技术相关进展

4、撰写相应的研究计划

课题五:基于深度自注意力模型的图像翻译技术探究(Image-to-Image Translation based on Deep Self-Attention Model)

期待结果:

1、调研并总结图像翻译以及深度自注意力模型的相关进展,并分析现有图像翻译工作的问题

2、分析图像翻译任务对全局信息以及远距离相关性的依赖性,了解深度自注意力模型在建模图像远距离相关性方面的优势

3、撰写相应的研究计划

我们也鼓励同学们发散思维,propose自己感兴趣的其他科研课题

本期《研究计划训练营》仅限30人

如果对课题感兴趣,请联系

添加小姐姐微信咨询详情

????????????

3、项目亮点

一、课程内容严格打磨,市面最专业最深入

市面上没有比我们的内容更专业深入的科研类计算机视觉项目,大部分科研项目只会讲解一些机器学习、神经网络的入门知识和算法,并不会涉及到深度学习中更深入的内容和应用。

二、项目提供的科研课题火热前沿,有非常大的延伸可能性

本项目提供的5个科研课题,都是目前计算机视觉领域最前沿最火热的,学生完成研究计划后,可以将其投入后续的科研工作中,并完成1篇有创新性的高水平学术论文。

三、授人以渔的真科研项目

内容涵盖:如何propose一个科研idea、如何找论文、如何读论文、领域知识点的讲解、研究方法的学习、撰写1篇符合学术标准的研究计划的方法和技巧、学术答辩的技巧等。参照实验室教授带研究生的模式,全程按照真正做一个科研项目的流程,让学生边学习边实操,真正做到融会贯通,掌握方法论,举一反三。

四、无需编程基础

本项目目标是产出1篇符合学术标准的研究计划,不需要学生有编程基础。

4、你将获得

  1. 1篇2000词以上,符合学术标准的中文或英文研究计划

  2. 课程证明及导师撰写的学术评价

  3. 了解基本的深度学习、计算机视觉领域研究思路和研究方法

  4. 掌握基于深度学习的底层视觉多个子任务的基本知识

  5. 认识底层计算机视觉领域的现状和前沿成果

  6. 对研究计划逻辑的把握及对科研的兴趣

  7. 在生活细节中分析和发现计算机视觉相关Idea的能力

  8. 模拟答辩,学会如何正确展示自己的研究成果,自如应对面试or套磁

5、适合人群

本项目适合计算机大类、数学、电子信息工程等相关专业方向,或对于深度学习、计算机视觉有浓厚兴趣,希望获得理论提高与实践认知的大三及以上学生。

无需具备编程基础,希望报名的同学对于神经网络和深度学习的基本概念有一些了解,如卷积、池化、归一化、激活函数、梯度反向传播等概念。以便提高后续学习效率。没有相关基础的同学,我们会提供课前预习材料给到大家。

6、未来的帮助

对升学的帮助

本课程涉及的深度学习基础知识以及其在底层计算机视觉领域的应用,是计算机算法尤其是计算机视觉算法、机器学习领域的必备知识/进阶能力,能为有意读计算机视觉、机器学习、人工智能等方向研究生的同学打下扎实基础/提升保研夏令营面试/考研复试/硕士博士申请的成功率。国内外多所大学(斯坦福大学、香中文大学、清华大学等)的知名研究组都十分看重学生的这些专业背景与实践。

对就业的帮助

本课程所涉及到的深度学习算法、图像增强复原等底层视觉相关技术,是就业时的必备能力/是提升就业竞争力的利器。就业方向包括:

  • 互联网大厂(腾讯,阿里巴巴,百度,字节跳动等)计算机视觉算法工程师

  • 硬件厂商(华为、小米、海康威视等)底层视觉研究团队算法工程师

  • AI或计算机视觉独角兽(商汤科技、旷视科技等)算法工程师

  • 国企、政府事业单位如电视台等相关研究团队工程师

●●●

本期《研究计划训练营》仅限30人

有意向参加可添加微信

咨询详情

????????????

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478279.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android硬件加速原理与实现简介

在手机客户端尤其是Android应用的开发过程中,我们经常会接触到“硬件加速”这个词。由于操作系统对底层软硬件封装非常完善,上层软件开发者往往对硬件加速的底层原理了解很少,也不清楚了解底层原理的意义,因此常会有一些误解&…

LeetCode 482. 密钥格式化

1. 题目 给定一个密钥字符串S,只包含字母,数字以及 ‘-’(破折号)。N 个 ‘-’ 将字符串分成了 N1 组。给定一个数字 K,重新格式化字符串,除了第一个分组以外,每个分组要包含 K 个字符&#xf…

暑期学校 | 东南大学2021年国际暑期学校项目:从感知理解到智能认知 (知识图谱及应用课程)...

国际暑期学校开课啦 项目介绍 从感知理解到智能认知——走近新一代人工智能From perceptual understanding to intelligent cognition-Approaching a new generation of AI本项目是由东南大学计算机科学与工程学院、软件学院、人工智能学院组织,通过开设人工智…

LeetCode 970. 强整数

文章目录1. 题目2. 解题2.1 暴力法2.2 优化双重循环1. 题目 给定两个正整数 x 和 y,如果某一整数等于 xi yj,其中整数 i > 0 且 j > 0,那么我们认为该整数是一个强整数。 返回值小于或等于 bound 的所有强整数组成的列表。 你可以按…

ACL'21 | 弱标签的垃圾数据,也能变废为宝!

文 | LawsonAbs编 | 小戏是不是感觉 NER 领域效果提升太过困难?最近一篇来自 Amazon 的文章提出使用强弱标签结合的方式来解决 NER 的问题。强弱标签结合其实非常立足实际的数据情况——干净又准确的强标签数据非常稀少,更多的是标注质量存在问题的弱标签…

会议交流 | “数据智能与知识服务”研讨会的专家报告题目已更新!

“数据智能与知识服务”研讨会的专家报告题目有更新啦!这些专家既有久负盛名的国际知名学者、也有具有前瞻洞见的业界领袖,更有精通各种工程实战的技术大咖。他们将围绕“数据智能与知识服务”的核心主题,为您带来一场豪华的学术盛宴&#xf…

dockerfile拉取python3.7镜像

docker构建python3.7镜像:https://zhuanlan.zhihu.com/p/137288195 FROM:需要什么环境 ENV:修改path,即增加/usr/local/bin这个环境变量 ADD:将本地代码放到虚拟容器中,它有两个参数,第一个是 .…

LeetCode 849. 到最近的人的最大距离

1. 题目 在一排座位( seats)中,1 代表有人坐在座位上,0 代表座位上是空的。 至少有一个空座位,且至少有一人坐在座位上。 亚历克斯希望坐在一个能够使他与离他最近的人之间的距离达到最大化的座位上。 返回他到离他…

可解释性:对神经网络中层特征复杂度的解释与拆分

文 | 任洁,李明杰,刘泽旭源 | 知乎大家好,我们是任洁,李明杰和刘泽旭,本研究是在张拳石老师 Qs.Zhang张拳石 指导下完成的工作。随着深度神经网络的应用日益广泛,可解释性也逐渐受到更多学者的关注。目前对…

新一代开源Android渠道包生成工具Walle

在Android 7.0(Nougat)推出了新的应用签名方案APK Signature Scheme v2后,之前快速生成渠道包的方式(美团Android自动化之旅—生成渠道包)已经行不通了,在此应用签名方案下如何快速生成渠道包呢&#xff1f…

领域应用 | 机器知道哪吒是部电影吗?解读阿里巴巴概念图谱AliCG

转载公众号 | PaperWeekly概念是人类认知世界的基石。比如对于“哪吒好看吗?”,“哪吒铭文搭配建议”两句话,人可以结合概念知识理解第一个哪吒是一部电影,第二个哪吒是王者荣耀的英雄。然而机器能理解吗?针对这一问题…

LeetCode 605. 种花问题

1. 题目 假设你有一个很长的花坛,一部分地块种植了花,另一部分却没有。可是,花卉不能种植在相邻的地块上,它们会争夺水源,两者都会死去。 给定一个花坛(表示为一个数组包含0和1,其中0表示没种…

美团点评业务风控系统构建经验

本文根据“第八届中国系统架构师大会”演讲内容整理而成。 美团最初以团购的形式出现,到现在有了很大的业务形态转变。尤其是经过与大众点评的业务融合,从单一业务发展成了覆盖到店餐饮、到店综合、猫眼、外卖、酒店、旅游等多个垂直领域的综合性电商&am…

95后程序员晒出工资单:狠补了这个,真香…

作为AI 初学者来说,最大的问题就是:资料太多!!!看不完!!!不知道如何取舍!!!人的精力有限!!!大部分想转行AI算法…

领域应用 | 小米在知识表示学习的探索与实践

转载公众号 | DataFunTalk导读:知识表示是知识获取与应用的基础,贯穿了小米知识图谱的构建与应用。本文将结合小米知识图谱的构建及小爱问答场景,介绍融合文本和知识图谱的知识表示学习方法,以及知识表示在知识图谱补全、实体链接…

LeetCode 563. 二叉树的坡度(DFS)

1. 题目 给定一个二叉树,计算整个树的坡度。 一个树的节点的坡度定义即为,该节点左子树的结点之和和右子树结点之和的差的绝对值。空结点的的坡度是0。 整个树的坡度就是其所有节点的坡度之和。 示例:输入: 1/ \2 3输出: 1 解释: 结点的坡度 …

多模态为什么比单模态好?第一份严谨证明来了!

文 | 橙橙子面试官: 听说你对多模态感兴趣,请问为什么多模态学习要比单模态学习效果好?候选人: 直观地,多模态学习可以聚合多源数据的信息,使得模型学习到的表示更加完备。以视频分类为例,同时使用字幕标题等文本信息、…

推荐:26种NLP练手项目(代码+数据)

1.分词 Word Segmentation chqiwang/convseg ,基于CNN做中文分词,提供数据和代码。 对应的论文Convolutional Neural Network with Word Embeddings for Chinese Word Segmentation IJCNLP2017. 2.词预测 Word Prediction Kyubyong/word_prediction &…

会议交流 | 最新NLP核心技术与前沿实践分享!

2021年7月10日,09:00-18:10,DataFunSummit:自然语言处理峰会将如约而至,本次峰会由3位主席和6位出品人精心策划而来,邀请来自业界的40余位嘉宾从NLP基础技术、语义表示与计算、多模理解与生成、信息抽取与检索、人机对…

LeetCode 504. 七进制数(进制转换)

1. 题目 给定一个整数,将其转化为7进制,并以字符串形式输出。 示例 1: 输入: 100 输出: "202"示例 2: 输入: -7 输出: "-10" 注意: 输入范围是 [-1e7, 1e7] 。来源:力扣(LeetCode) 链接&#xf…