GitHub上有哪些比较好的计算机视觉/机器视觉的项目?

640?wx_fmt=jpeg

来源:Unsplash,作者: JR Korpa 

来源:知乎问题

今天分享一下 Github 上不错的计算机视觉或者机器视觉方面的项目,包括入门的教程、非常经典的算法和实战项目等等。

今日推荐文章

github标星11600+:最全的吴恩达机器学习课程资源(完整笔记、中英文字幕视频、python作业,提供百度云镜像!)


计算机视觉联盟

https://www.zhihu.com/question/30049772/answer/831391266

从个人经历出发,全部都是自己在成长过程中所收集到的干货项目,很多都是自己经过筛选自己总结的,保证你能获取的是干货,拿走不谢!本王只需您的点赞和关注!

【1】机器学习西瓜书手推笔记(PDF可打印版本)

自己的纯手推笔记,附PDF可打印版本

https://github.com/Sophia-11/Machine-Learning-Notes

【2】计算机视觉领域资源汇总

汇集了计算机视觉资源汇总,包含计算机视觉方向算法汇总、论文汇总

https://github.com/Sophia-11/Awesome-CV-Resources

【3】计算机视觉顶会ICCV2019论文集(标星90)

持续更新收集所有ICCV2019论文集,做科研,搞算法,跟踪最前沿论文思路,少不了这些顶会论文,附下载链接

https://github.com/Sophia-11/Awesome-ICCV2019

【4】再几个目标检测经典算法链接:

YOLO darknet版本:

https://pjreddie.com/darknet/yolo/

YOLO Keras版本:

https://github.com/qqwweee/keras-yolo3

YOLO mobilenet:

caffe Linux 和Windows 版本:

https://github.com/eric612/MobileNet-YOLO

https://github.com/eric612/Caffe-YOLOv3-Windows

Keras版本:

https://github.com/Adamdad/keras-YOLOv3-mobilenet

MXNET版本:

https://gluon-cv.mxnet.io/model_zoo/detection.html#yolo-v3

https://github.com/sufeidechabei/gluon-mobilenet-yolov3

机器学习西瓜书手推笔记(PDF可打印版本)

Table of Contents

第一章绪论

第一章 绪论

高清图见GitHub链接:https://github.com/Sophia-11/Machine-Learning-Notes

640?wx_fmt=jpeg

第二章 模型评估与选择

640?wx_fmt=jpeg
640?wx_fmt=jpeg

计算机视觉领域资源汇总

Table of Contents

全球高校计算机视觉实验室名单

计算机视觉算法资源汇总

AI顶会(2019~2020)

640?wx_fmt=jpeg

写了这么多的,希望得到您的关注和点赞,如果想获取更多,可以查看GitHub或关注公众号【计算机视觉联盟】!


量子位的回答

https://www.zhihu.com/question/30049772/answer/741863783

谷歌大脑Quoc Le团队,又训练出了一只地表最强的模型。

640?wx_fmt=jpeg

那是一个目标检测模型,从前并不是最强大。

但自从用机器学习解锁了特别的数据扩增策略,再用自动扩增来的新数据集训练目标检测模型,事情就完全不同了。

注意:目标检测和分类不一样,分类不需要标注边界框,而目标检测需要。

640?wx_fmt=jpeg

△ 左边是自动扩增数据,右边是成绩提升

模型在COCO目标检测任务上,拿到了50.7 mAP的最高分,刷新从前的纪录。

谷歌的方法,并没有改变模型本身,但有效提升了准确率,+2.3 mAP以上。

团队还强调,AI在COCO数据集里学到的扩增策略,直接迁移到其他数据集上,同样可以提升准确率。

现在,算法已经开源了,AI学到的扩增策略也在里面。

是怎样的扩增策略?

论文写到,这里的数据扩增只涉及了一些简单变换 (Simple Transformations) :

有应用在整张图片上、但不会影响边界框的那种变换,比如从图像分类里借来的颜色变换 (Color Transformations)。

也有不影响整张图片、但改变边界框位置的那种变换,比如图像平移 (Translating) 或剪切 (Shearing) 。

注意,这些变换只用在训练过程中,不会用到测试环节里。

研究人员说,当变换的数量越来越庞大的时候,就很难手动把它们有效组合到一起了。

所以,就要用机器学习,搜索出更适合目标检测任务的组合策略。

思路是这样的:

团队把数据扩增搜索 (Data Augmentation Search) 看做一个离散的优化问题,优化的是模型的泛化表现。

在自家的另一篇论文 (arXiv:1805.09501) 基础上,把重点转移到针对目标检测的扩增策略上。

比起图像分类任务的数据扩增,目标检测的难点在于,要保持边界框和发生形变的图像之间的一致性(Consistency) 。

而边界框的标注,也为数据扩增提供了一种新的方式:只在边界框里面修改图像。就像上文讲的那样。

另外,团队还探索了在图片发生几何变换 (Geometric Transformations) 的情况下,怎样去改变边界框的位置。

具体方法是这样的:

把扩增策略定义成一组无序的子策略 (Sub-Policy) 。

在训练过程中,每个子策略都会被随机选中,应用到当前的图片里去。

每个子策略里,有N个图片变换,依次在同一张图上进行。

要把这个搜索过程,变成一个离散的优化问题,就要创建一个搜索空间。

空间里面,有5个种策略,每种子策略有2种图像变换运算。

另外,每个运算还和两个超参数相关联,一个是代表应用这个运算的可能性 (Probability) ,二是这个运算的大小 (Magnitude) 。

初步实验之后,团队定下了22种图像变换运算。

学习完成的子策略,成效是这样的:

640?wx_fmt=jpeg

肉眼可见,成效显著。

一是在COCO目标检测中,以50.7 mAP拔得头筹,(比策略训练前) 提升了2.3 mAP。

二是在PASCAL VOC目标检测中,提升了2.7 mAP。

也就是说,在COCO上训练好的策略,直接搬到其他数据集上也有效。

团队说,这个方法尤其适合在小数据集中避免过拟合

代码开源了,你也去试一下吧。

论文传送门:

https://arxiv.org/abs/1906.11172

代码传送门:

https://github.com/tensorflow/tpu/tree/master/models/official/detection

— 完 —

量子位


「已注销」

https://www.zhihu.com/question/30049772/answer/127460083

非常多啊

先说说较大的框架项目:

  • **OpenCV **https://github.com/opencv/opencv

  • dlib https://github.com/davisking/dlib

  • Caffe https://github.com/BVLC/caffe

  • Mxnet https://github.com/dmlc/mxnet

  • tensorflowhttps://github.com/search%3Futf8%3D%25E2%259C%2593%26q%3Dtensorflow

视觉这块最主要的检测以及追踪

检测:

  • RCNN,Fast-RCNN,Faster-RCNN 现在最主流的检测框架,https://github.com/rbgirshick/py-faster-rcnn -- see https://github.com/ShaoqingRen/faster_rcnn for the official MATLAB version

  • SSD,达到实时的检测算法,https://github.com/weiliu89/caffe/tree/ssd

  • DPM,早期的检测算法,使用latent SVM GitHub - https://github.com/rbgirshick/voc-dpm. 

追踪:

TLD,非常鲁棒的跟踪算法 https://github.com/zk00006/OpenTLD


孔涛

https://www.zhihu.com/question/30049772/answer/107232336

我来回答几个,以下的几个代码我都实际运行过,有一部分仔细读过。

  1. pdollar (Piotr Dollar) https://github.com/pdollar

Piotr's Computer Vision Matlab Toolbox,里边包含各种各样的算法,包括特征提取、分割、分类稍等等。

  1. DL系列

  • Caffe: https://github.com/BVLC/caffe: a fast open framework for deep learning.

  • model zoo: https://github.com/BVLC/caffe/wiki/Model-Zoo,这个里边包含了基于caffe实现的各种各样的模型。

  1. voc-dpm

  2. 铅笔画的自动生成,把一副图像变成铅笔水粉画,感觉很酷很酷炫有木有


匿名用户

https://www.zhihu.com/question/30049772/answer/47066644

https://github.com/jbhuang0604/awesome-computer-vision

来自 https://github.com/bayandin/awesome-awesomeness ,各种领域的 Awesome。

虽然绝大多数情况下都是马了不看


欢迎关注我的微信公众号--算法猿的成长,或者扫描下方的二维码,大家一起交流,学习和进步!

640?wx_fmt=png

如果觉得不错,在看、转发就是对小编的一个支持!

推荐阅读

  • Github项目|几行代码即可实现人脸检测、目标检测的开源计算机视觉库

  • 你有哪些deep learning(rnn、cnn)调参的经验?

  • 国内有哪些不错的CV(计算机视觉)团队

  • 实战|手把手教你训练一个基于Keras的多标签图像分类器

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/408500.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

20个常用的Python小技巧

2019 年第 73 篇文章,总第 97 篇文章 原题 | 20 Python Snippets You Should Learn Today 作者 | Chaitanya Baweja 原文 | https://medium.com/better-programming/20-python-snippets-you-should-learn-today-8328e26ff124 译者 | kbsc13("算法猿的成长&q…

leetcode 刷500道题,笔试/面试稳吗?谈谈算法的学习

来源公众号:苦逼的码农作者:帅地想要学习算法、应付笔试或者应付面试手撕算法题,相信大部分人都会去刷 Leetcode,有读者问?如果我在 leetcode 坚持刷它个 500 道题,以后笔试/面试稳吗?这里我说下…

hdu4714 Tree2cycle 把树剪成链

题目是问把一棵树通过剪边、加边形成一个环的最小代价。 分成两步,先把树剪成一些链,再把链连接成一个环。 设一棵有n个节点的树,剪掉X条边后,形成L条链。 那么代价为XL。 n-1-XedgeNum(L条链) ① //原本有n-1条边,剪掉…

github标星58500+:常见数据结构与算法的python实现

昨天分享的文章介绍了如何学习数据结构算法:今天介绍一个 github 仓库,用 Python 实现了常见的数据结构与算法。另外,前几天的红包抽奖,今晚就开奖了,还没参与的,赶紧点进来:有人问我数据结构与…

【吐血整理】那些让你起飞的计算机基础知识:学什么,怎么学?

作者:帅地来源公众号:苦逼的码农我公众号里的文章,写的大部分都是与计算机基础知识相关的,这些基础知识,就像我们的内功,如果在未来想要走的更远,这些内功是必须要修炼的。框架千变万化&#xf…

数据结构算法入门--一文了解什么是复杂度

图片来自 Pixabay,作者:TeroVesalainen2019 年第 74 篇文章,总第 98 篇文章本文大约 3000 字,阅读大约需要 10 分钟最近会开始更新一个数据结构算法的学习系列,同时不定期更新 leetcode 的刷题。这是第一篇文章&#x…

一文了解数组

2019 年第 75 篇文章,总第 99 篇文章”数据结构算法入门系列的第二篇,这次介绍下数组, 数组是一个最基础而且常见的数据结构,几乎每种编程语言都有。上一篇文章:数据结构算法入门--一文了解什么是复杂度今日推荐阅读…

Python3.8 了解的差不多了吧,Python3.9 新特性了解一下!

"Python学习开发",一个值得加星标的公众号。正文共:4946 字 1 图预计阅读时间:13 分钟作者:陈祥安原文有删改:https://docs.python.org/3.9/whatsnew/3.9.html本文将解释 Python 3.9 中的新特性,而不是 3.8。有关完整的…

首发:适合初学者入门人工智能的路线及资料下载

本文为AI入门提供了一个简易的学习路线,并提供了代码和数据集下载。(黄海广)一、前言AI以及机器学习入门,初学者遇到的问题非常多,但最大的问题就是:资料太多!!!看不完&a…

数据结构算法入门--链表

2019 年第 76 篇文章,总第 100 篇文章 本文大约 3200 字,阅读大约需要 10 分钟 数据结构算法系列: 数据结构算法入门系列第三篇--链表,链表也是非常常见的数据结构,面试过程中也会经常考到相关的题目。 本文首先介绍链…

react学习(3)----不能在该位置用setstate

this.setState({ pageIndex: 1, pageSize: 10, });

带你少走弯路:强烈推荐的Keras快速入门资料和翻译(可下载)

上次写了TensorFlow和PyTorch的快速入门资料,受到很多好评,读者强烈建议我再出一个keras的快速入门路线,经过翻译和搜索网上资源,我推荐4份入门资料,希望对大家有所帮助。备注:另外两个入门资料很负责任地说…

Mac 下安装配置 Python 开发环境

图片来源:Unsplash,作者 Markus Spiske 2019 年第 77 篇文章,总第 101 篇文章前言记录下 Mac 电脑的开发环境安装配置,主要包括:安装&使用Homebrew安装使用 git安装 anaconda,配置 python3 环境安装 ju…

react学习(5)----通过设置初始值控制页面render渲染

boothActivityCode: this.props.location.query.code || ,