Giter Club home page Giter Club logo

facemaskdetection's Introduction

FaceMaskDetection

[updates]

人脸口罩检测,现开源所有主流框架模型和推理代码,支持的框架如下:

  • PyTorch
  • TensorFlow(包含tflite模型和pb模型)
  • Keras
  • MXNet
  • Caffe

检测人脸并判断是否佩戴了口罩, 并开源近8000张人脸口罩标注数据

Detect faces and determine whether they are wearing mask.

首先,祝愿我国和世界各国早日战胜新冠肺炎疫情,武汉加油!**加油!

  • 我们开源了人脸口罩检测的所有主流框架(PyTorch、TensorFlow、Keras、MXNet和caffe)(使用keras训练的模型,并转换得到的其他框架模型),并提供了所有五大框架的的推理代码。所有模型都在models文件夹下。

  • 开源了标注的7959张人脸标注图片,数据集来自于WIDER FaceMAFA数据集, 我们重新修改了标注并进行了校验(主要是 MAFA和WIDER Face的人脸位置定义不一样,所以我们进行了修改标注)并将其开源出来。(有需要的朋友,敬请关注我们新建的公众号AIZOO(本文末也有二维码,可以扫描关注),回复口罩数据集就可以了。公众号刚开,恳请大家帮忙关注和扩散一下~)

模型结构

我们在本项目中使用了SSD类型的架构,为了让模型可以实时的跑在浏览器以及终端设备上,我们将模型设计的非常小,只有101.5万个参数。模型结构在本文附录部分。

本模型输入大小为260x260,主干网络只有8个卷积层,加上定位和分类层,一共只有24层(每层的通道数目基本都是32\64\128),所以模型特别小,只有101.5万参数。模型对于普通人脸基本都能检测出来,但是对于小人脸,检测效果肯定不如大模型。具体效果,大家可以点击以下链接,访问我们的网站在线体验效果。 aizoo.com跑在您浏览器的口罩检测模型

网页使用了Tensorflow.js库,所以模型是完全运行在您浏览器里面的。运行速度的快慢,取决于您电脑配置的高低。

模型在五个卷积层上接出来了定位分类层,其大小和anchor设置信息如下表.

卷积层 特征图大小 anchor大小 anchor宽高比(aspect ratio)
第一层 33x33 0.04,0.056 1,0.62,0.42
第二层 17x17 0.08,0.11 1,0.62,0.42
第三层 9x9 0.16,0.22 1,0.62,0.42
第四层 5x5 0.32,0.45 1,0.62,0.42
第五层 3x3 0.64,0.72 1,0.62,0.42

运行方法

pytorch

如果您要运行图片:

python pytorch_infer.py  --img-path /path/to/your/img

如果您要在视频上跑,只需要:

python pytorch_infer.py --img-mode 0 --video-path /path/to/video  
# 如果要打开本地摄像头, video_path填写0就可以了,如下
python pytorch_infer.py --img-mode 0 --video-path 0

TensorFlow/Keras/MXNet/Caffe

另外四大框架运行方法基本类似,只不过将pytorch_infer.pypytorch的换成对应框架名字即可即可,以TensorFlow为例:

python tensorflow_infer.py  --img-path /path/to/your/img

注意,对于caffe的推理,我们使用了permute层,所以需要使用caffe-ssd,也就是SSD作者开源的caffe版本,官方版本的caffe并不包含permute层。您也可以使用opencv的dnn模块来加载模型推理,opencv支持permute层。

不过如果您需要可以在官方版本的caffe上可以运行的模型,也可以联系我们修改模型,实现不需要permute层的模型。

附录

问题反馈与交流

欢迎AI圈和科技圈的朋友关注我们的公众号,这是我们分享AI技术和资讯的地方。我们要做的事情是搭建开发者和AI算法和产品需求方的一个桥梁,欢迎有AI算法需求的朋友关注我们,也欢迎有熟练算法和开发经验的工程师添加我们,与我们交流。

如果你有任何问题,欢迎关注我们的公众号,通过后台给我留言,或者添加作者元峰的微信AIZOOTech与我联系 ,我会将您拉入AIZOO技术交流群。 我们的技术交流群二维码,欢迎算法开发者和需求方进群交流,请输入备注,例如张三丰-浙大-目标检测或者张三丰-腾讯-图像分割

模型结构图

为了可视化方便,我们省略了BN层,如果您要查看完整模型,可以查看img文件夹的face_mask_detection.hdf5.png图片

测试集PR曲线

因为WIDER face是一个任务比较复杂的数据集,我们的模型又设计的非常小,所以对于人脸的PR曲线并不是那么性感。这点可以通过设计大模型来提升对于小人脸的检测效果,如果您有需求,欢迎通过上述二维码联系我们。

我们的网页长这样

欢迎大家点击链接在线体验

aizoo.com跑在您浏览器的口罩检测模型

facemaskdetection's People

Contributors

daniellchiang avatar aizootech avatar

Watchers

James Cloos avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.