博客
关于我
GitHub趋势榜第一:超强PyTorch目标检测库Detectron2,训练更快,支持更多任务
阅读量:255 次
发布时间:2019-03-01

本文共 1724 字,大约阅读时间需要 5 分钟。

栗子 发自 凹非寺
量子位 报道 | 公众号 QbitAI

640?wx_fmt=gif

PyTorch目标检测库Detectron2诞生了,Facebook出品。

站在初代的肩膀上,它训练比从前更快,功能比从前更全,支持的模型也比从前更丰盛。

开源5天,已在GitHub收获3100星,还成了趋势榜第一:

640?wx_fmt=png

除此之外,团队把大规模姿态估计算法DensePose,做出了基于Detectron2的新版本。

Facebook说,像DensePose一样,今后会有更多研究项目,在Detectron2上搭建起来。

这样,就可以把它当成一个广泛支持各种研究工作的库了。

那么,现在就来仔细观察一下,Detectron2都发生了哪些进化:

全方位升级

640?wx_fmt=gif

首先,Detectron2比起初代,最明显的变化是:

基于PyTorch了,初代还是在Caffe2里实现的。

团队说,PyTorch有直观的指令式编程,这样就能更快地迭代模型设计和实验。

Detectron2是在PyTorch里从零开始写成的,团队希望这种做法,能让用户享受PyTorch做深度学习的思路。社区更活跃的话,PyTorch也会变得更好。

640?wx_fmt=jpeg

第二个变化,是模块化了。

所谓模块化,就是用户可以把自己定制的模块实现,加到一个目标检测系统的任何部分里去。

这意味着许多的新研究,都能用几百行代码写成,并且可以把新实现的部分,跟核心Detectron2库完全分开。

除此之外,还有许多新支持的模型、功能和任务:

新模型&新功能

首先,Detectron2包含了一代可用的所有模型:

比如Faster R-CNN,Mask R-CNN,RetinaNet,DensePose等等。

640?wx_fmt=gif

然后,加入了一些新模型:

比如Cascade R-NN,Panoptic FPN,以及TensorMask。

今后,陆续会有新的算法支持。

功能方面,二代新支持了同步批量归一化 (synchronous Batch Norm) ,也支持了LVIS等等许多新的数据集。

新任务

和目标检测有关的任务,初代已经支持了一部分,二代也都支持:

有边界框的目标检测,实例分割mask,以及人类姿态预测。

640?wx_fmt=png

在这基础之上,二代又增加了新任务:

语义分割和全景分割 (Panoptic Segmentation) ,这是一个把语义分割和实例分割结合到一起的任务。速度快

博客提到,由于把整个训练pipeline移到了GPU上,二代比初代更快了,在许多模型上都是如此。分布式训练,让几台GPU一起跑的话,还可以把训练规模扩张到更大的数据集上。

速度的对比,是用第100-500次迭代之间的平均吞吐量 (Average Throughput) 作为指标。这样就跳过了GPU预热时间。结果如下:

640?wx_fmt=png

肉眼可见的加速。

注意,对于R-CNN这类模型,一个模型的吞吐量会随着训练的进行而变化,这取决于模型的预测。

因此,这个指标也不能和model zoo里的“训练速度”相提并论。model zoo用的是整个训练过程运行的平均速度。

部署一下

最后,Facebook的计算机视觉攻城狮们,实现了一个额外的软件层,叫Detectron2go。

有了它,就可以更快地把新实现的模型,部署到生产环节。

这一层的功能包括了标准训练工作流,带有内部数据集,网络量化,以及模型转化 (为了给云端和移动端部署,选择各自最优的格式) 。

传送门

总之,训练起来更顺滑了,支持的任务也广泛了,快点用起来吧:640?wx_fmt=png

GitHub项目:https://github.com/facebookresearch/detectron2https://ai.facebook.com/blog/-detectron2-a-pytorch-based-modular-object-detection-library-/

活动推荐 | 科大讯飞1024开发者节

10月24日-26日,一场开发者的盛会。

120+国内外专家学者,20+场高峰论坛;10000平米AI黑科技互动展区,更有AI公益音乐节、AI公益健康跑助力!

扫码可获取量子位专属福利,进入原价1024元的【免费票】通道

640?wx_fmt=jpeg

喜欢就点「好看」吧 ! 

转载地址:http://pfxt.baihongyu.com/

你可能感兴趣的文章
mariadb multi-source replication(mariadb多主复制)
查看>>
MariaDB的简单使用
查看>>
MaterialForm对tab页进行隐藏
查看>>
Member var and Static var.
查看>>
memcached高速缓存学习笔记001---memcached介绍和安装以及基本使用
查看>>
memcached高速缓存学习笔记003---利用JAVA程序操作memcached crud操作
查看>>
Memcached:Node.js 高性能缓存解决方案
查看>>
memcache、redis原理对比
查看>>
memset初始化高维数组为-1/0
查看>>
Metasploit CGI网关接口渗透测试实战
查看>>
Metasploit Web服务器渗透测试实战
查看>>
MFC模态对话框和非模态对话框
查看>>
Moment.js常见用法总结
查看>>
MongoDB出现Error parsing command line: unrecognised option ‘--fork‘ 的解决方法
查看>>
mxGraph改变图形大小重置overlay位置
查看>>
MongoDB可视化客户端管理工具之NoSQLbooster4mongo
查看>>
Mongodb学习总结(1)——常用NoSql数据库比较
查看>>
MongoDB学习笔记(8)--索引及优化索引
查看>>
mongodb定时备份数据库
查看>>
mppt算法详解-ChatGPT4o作答
查看>>