Giter Club home page Giter Club logo

islouishsu.github.io's People

Stargazers

 avatar  avatar  avatar  avatar

Forkers

shanhaiying

islouishsu.github.io's Issues

深度学习框架darknet【二】——目录结构 | LOUIS' BLOG

https://louishsu.xyz/2019/12/08/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E6%A1%86%E6%9E%B6darknet%E3%80%90%E4%BA%8C%E3%80%91%E2%80%94%E2%80%94%E7%9B%AE%E5%BD%95%E7%BB%93%E6%9E%84/

Tree1234567891011121314151617181920$ tree -L 1.├── cfg/├── data/├── examples/├── include/├── python/├── scripts/├── src/├── LICENSE├── LICENSE.fuck├── LICENSE.gen├── LICENSE.gpl├── LICENSE.meta├── LIC

SphereFace, CosFace, ArcFace | LOUIS' BLOG

https://louishsu.xyz/2019/07/13/SphereFace-CosFace-ArcFace/

文中合成gif图不清晰,原图可在该页面下载获取 前言深度神经网络可将样本映射到超空间中的嵌入向量,然而若不在损失中增加几何约束,该超空间中的嵌入向量不具有几何意义。现对空间中嵌入向量间的余弦距离研究甚是火热,可用于open-set数据集的识别问题,特别是人脸验证问题。 所谓open-set与close-set,是指训练集中是否包含测试集中的类别,如人脸问题中,训练集不可能包含所有人的人脸数

【数据结构】线性表 | LOUIS' BLOG

https://louishsu.xyz/2020/02/17/%E3%80%90%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84%E3%80%91%E7%BA%BF%E6%80%A7%E8%A1%A8/

线性表数据结构定义:线性表(linear list)也称有序表(ordered list),他的每一个实例都是元素的一个有序集合。对于形如$(e_0, e_1, \dots, e_{n-1})$的实例,$n$为有穷自然数表示线性表的长度或大小,$e_i$为线性表的元素,$i$是元素$e_i$的索引。可以认为$e_0$先于$e_1, \cdots, e_{n-1}$,除了这种先后关系外,线性表不再有

人间失格 | LOUIS' BLOG

https://louishsu.xyz/2019/07/21/%E4%BA%BA%E9%97%B4%E5%A4%B1%E6%A0%BC/

人类是群居的孤独者。 第一手札 尽管如此,他们却能够不死自杀,免于疯狂,纵谈政治,竟不绝望,不屈不挠,继续与生活搏斗。他们不是并不痛苦吗?他们使自己成为彻底的利己主义者,并虔信那一些里所担任,曾几何时怀疑过自己呢?这样一来,不是很轻松惬意吗? 太平洋战争爆发后,当时的许多作家纷纷创造起了激发人们战斗欲望的小说作品,唯独太宰治不一样,他从不去碰战争题材,相反的,太宰治为了让那些为了度过困难时期

Non-parameter Estimation | LOUIS' BLOG

https://louishsu.xyz/2018/11/19/Non-parameter-Estimation/

前言若参数估计时我们不知道样本的分布形式,那么就无法确定需要估计的概率密度函数,无法用最大似然估计、贝叶斯估计等参数估计方法,应该用非参数估计方法。 需要知道的是,作为非参数方法的共同问题是对样本数量需求较大,只要样本数目足够大众可以保证收敛于任何复杂的位置密度,但是计算量和存储量都比较大。当样本数很少时,如果能够对密度函数有先验认识,则参数估计能取得更好的估计效果。 基本原理若有$M$个样本$x

Logistic Regression | LOUIS' BLOG

https://louishsu.xyz/2018/10/18/Logistic-Regression/

引言逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题,常见的是二分类或二项分布问题,也可以处理多分类问题,它实际上是属于一种分类方法。 模型先给出模型,推导过程稍后给出,逻辑回归包含Sigmoid函数 f(z) = \frac{1}{1+e^{-z}}其图像如下 定义 z = w^Tx其中$x=[x_0, x_1, …, x_n]^T, x_0=1$ h_w(

Face Detection: MTCNN | LOUIS' BLOG

https://louishsu.xyz/2019/05/05/Face-Detection-MTCNN/

前言MTCNN即Multi-task Cascaded Convolutional Networks,利用深度学习方法进行人脸识别、检测与关键点定位,可谓结合机器视觉领域三大任务为一体。 该算法中,人脸检测与识别视作分类任务,即判别框内图像是否包含人脸;定位视作回归任务,共需确定7个坐标点,依次为:回归框左上、右下坐标,左眼、右眼、鼻尖、左嘴角、右嘴角坐标。 在设计损失函数时,分类任务采用交叉熵(

详细!MTCNN训练全过程! | LOUIS' BLOG

https://louishsu.xyz/2019/11/10/%E8%AF%A6%E7%BB%86%EF%BC%81MTCNN%E8%AE%AD%E7%BB%83%E5%85%A8%E8%BF%87%E7%A8%8B%EF%BC%81/

前言记录一下详细的MTCNN训练过程,之前损失函数的问题,训练得到网络效果一般,就拖到了最近。原理在之前写的博客Face Detection: MTCNN中已说明,本文不做详细介绍。详细代码可见本人代码仓库MTCNN_Darknet - Github。 数据集 数据集使用的是WIDER FACE: A Face Detection Benchmark与Deep Convolutional Net

挪威的森林 | LOUIS' BLOG

https://louishsu.xyz/2019/08/10/%E6%8C%AA%E5%A8%81%E7%9A%84%E6%A3%AE%E6%9E%97/

前言Reference 没有人喜欢孤独,只是不愿失望。 时至今日,我才恍然领悟到直子之所以求我别忘掉她的原因。直子当然知道,知道她在我心目中的记忆迟早要被冲淡。也惟其如此,她才强调说:希望你能记住我,记住我曾这样存在过。 想到这里,我就悲哀得难以自禁。因为,直子连爱都没爱过我的。 死并非生的对立面,而作为生的一部分永存。 或许我的心包有一层硬壳,能破壳而入的东西是极其有限的。所以我才不能对人

YOLO! v1, v2, v3 | LOUIS' BLOG

https://louishsu.xyz/2019/09/01/YOLO-v1-v2-v3/

前言YOLO是You Only Look Once的简称,是one-stage检测算法,在2016年刚提出时风靡一时,现在看可能存在一些缺点,后续有许多one-stage检测算法都参考YOLO的思路,如SSD。目前位置,YOLO共发布了3代,论文链接在Reference中。 YOLOv1YOLO的一个关键点是,将目标检测作为回归任务,将分离的边界框回归和分类联合起来,可进行端到端的优化。 We

TF-IDF | LOUIS' BLOG

https://louishsu.xyz/2018/10/25/TF-IDF/

引言正在做LintCode上的垃圾邮件分类,使用朴素贝叶斯方法解决,涉及到文本特征的提取。TF-IDF(词频-逆文档频率)算法是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 计算步骤词频(TF)Term Frequency,就是某个关键字出现的频率,具体来讲,就是词库

LDA | LOUIS' BLOG

https://louishsu.xyz/2019/04/22/LDA/

前言在PCA中,介绍了无监督降维方法,主成分分析(Principal Components Analysis)。从投影后数据方差最大的角度出发,选取主轴。下面介绍一种有监督的降维方法,线性判别分析(Linear Discriminant Analysis)。 原理设有$n$维样本集$D={x^{(1)}, …, x^{(i)}, …, x^{(m)}}$,所属类别数目为$C$,现求其第一投影轴

Support Vector Machine | LOUIS' BLOG

https://louishsu.xyz/2019/05/27/Support-Vector-Machine/

前言Github: isLouisHsu/Basic-Machine-Learning-Algorithm/algorithm/p97_svm.py 补一补支持向量机的笔记。 支持向量机(SVM)为有监督学习算法,可用于回归、分类甚至聚类(支持向量聚类),其主要特点为 将样本表示为超空间中的点; 求取支持向量,其余样本点对超平面无影响; 对于线性不可分问题,利用核函数映射到高维空间,使其线性可分

CenterNet - Objects as Points | LOUIS' BLOG

https://louishsu.xyz/2019/10/09/CenterNet-Objects-as-Points/

前言目前大多检测算法将物体视作边界框进行检测,并采用锚框(Anchor),能很大程度提升检测算法的表现,但是Anchor难以确定参数,且增加大量网络运算量。目前的物体检测算法开始向无Anchor的方向发展,如本文的CenterNet,是把物体所在包围框作为点,并结合热图的形式进行。除物体检测外,此算法还可用于人体姿态识别、3D物体检测等。 论文阅读Introduction In this pape

深度学习框架darknet【五】——训练解析 | LOUIS' BLOG

https://louishsu.xyz/2019/12/08/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E6%A1%86%E6%9E%B6darknet%E3%80%90%E4%BA%94%E3%80%91%E2%80%94%E2%80%94%E8%AE%AD%E7%BB%83%E8%A7%A3%E6%9E%90/

前言前一节介绍了如何调用函数进行网络的训练,本节扒一扒源码,详细介绍前向、反向、更新部分。查看本节内容要有BP算法的基础,以全连接网络为例,详细查看全连接网络BP算法推导【矩阵形式】。 Dataflow运算过程中最重要的是数据的传递,在整个过程中,向系统申请的内存资源(部分)列表如下| 内存地址指针 | 类型 | 功能 || :———————— | :—- | :—- || dat

Eigenface and Fisherface | LOUIS' BLOG

https://louishsu.xyz/2019/08/20/Eigenface-and-Fisherface/

前言在众多人脸图像中,能否找到特一组特征脸,用于表征其他人脸呢?在PCA和LDA中分别介绍了两种线性降维方法,本文介绍一种使用以上两种算法的特征提取方法。 原理EigenfaceEigenface由Sirovich与Kirby在1987年提出,认为人脸图像可由一系列特征图加权组合重构而成,即 F = F_m + \sum_i w_i F_i \tag{1}Eigenface可通过PCA生成,在大量

SVD | LOUIS' BLOG

https://louishsu.xyz/2018/10/23/SVD/

引言奇异值分解Singular Value Decomposition是线性代数中一种重要的矩阵分解,奇异值分解则是特征分解在任意矩阵上的推广。在信号处理、统计学等领域有重要应用。 原理从特征值分解(EVD)讲起我们知道对于一个$n$阶方阵$A_{n×n}$,有 A\alpha_i = \lambda_i \alpha_i i = 1, ..., n取 P = \left[\alpha_1,

about | LOUIS' BLOG

https://louishsu.xyz/about/

一个无趣的工科男说, 总想写点什么东西, 内心肿胀,却无从下笔。 所以我们 —— 推公式吧!:-) 的确是孤独的过程, 但并非受人之托在写, 不能带着抱怨。 也许什么时候, 就开始写写, 再写写, 再写写。 致 —— 未落笔的鸡汤文。

深度学习框架darknet【三】——调包大法好 | LOUIS' BLOG

https://louishsu.xyz/2019/12/08/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E6%A1%86%E6%9E%B6darknet%E3%80%90%E4%B8%89%E3%80%91%E2%80%94%E2%80%94%E8%B0%83%E5%8C%85%E5%A4%A7%E6%B3%95%E5%A5%BD/

前言本节以YOLO为例,介绍如何调用darknet函数来进行网络训练和测试,对框架有一个整体的认识。 Main主函数入口在examples/darknet.c/main,命令行指定参数yolo即可进入yolo的运行函数段12$ ./darknet yolousage: ./darknet yolo [train/test/valid] [cfg] [weights (optional)] 由以下代

NMS & soft-NMS | LOUIS' BLOG

https://louishsu.xyz/2019/05/26/NMS-softer-NMS/

前言在目标检测中,若多个回归框(Bounding Box)重叠内容较多,则可以保留其中几个,删除其余冗余的框,非极大值抑制(Non-Maximum Suppression, NMS)算法可实现该功能。 那么用什么指标评价两个回归框重叠过多呢,以下介绍图像的交并比IoU(Intersection over Union)。 IoU原理IoU的思路非常简单,即计算两个回归框交集部分面积与并集面积的比值,

全连接网络BP算法推导【矩阵形式】 | LOUIS' BLOG

https://louishsu.xyz/2019/12/08/%E5%85%A8%E8%BF%9E%E6%8E%A5%E7%BD%91%E7%BB%9CBP%E7%AE%97%E6%B3%95%E6%8E%A8%E5%AF%BC%E3%80%90%E7%9F%A9%E9%98%B5%E5%BD%A2%E5%BC%8F%E3%80%91/

前言在Feedforward Neural Network/5. 梯度推导中介绍了前馈神经网络的BP算法,但是推导结果为对元素的梯度,不便于编程且影响计算效率。本节以3层前馈全连接神经网络为例,介绍矩阵形式的BP算法推导。 网络定义定义多层全连接网络:【输入(input)】 -> 全连接层 -> sigmoid -> 【隐藏层(hidden)】-> 全连接层 -> 【

《教父》三部曲:充满腐败而不失庄重的资本主义气息 | LOUIS' BLOG

https://louishsu.xyz/2019/10/05/%E3%80%8A%E6%95%99%E7%88%B6%E3%80%8B%E4%B8%89%E9%83%A8%E6%9B%B2%EF%BC%9A%E5%85%85%E6%BB%A1%E8%85%90%E8%B4%A5%E8%80%8C%E4%B8%8D%E5%A4%B1%E5%BA%84%E9%87%8D%E7%9A%84%E8%B5%84%E6%9C%AC%E4%B8%BB%E4%B9%89%E6%B0%94%E6%81%AF/

简介《教父》三部曲每一部都很精彩,第二部主角是个活生生的反例,可能稍逊一筹。 第一部《教父》介绍的是柯里昂家族反对毒品交易而引起的大风波,是三部曲中唯一一部被拍成电影的书(电影《教父Ⅰ》完美还原,表现力很强,但缺少细节导致剧情不太连续)。个人认为,维托·唐·柯里昂是三部曲中唯一一位称得上是教父的人,其度量、耐心、冷静与智慧让人折服。教父因拒绝毒品交易被枪击,随后小儿子迈克·柯里昂替父报仇潜逃西西

PCA | LOUIS' BLOG

https://louishsu.xyz/2018/10/22/PCA/

引言PCA全称Principal Component Analysis,即主成分分析,是一种常用的数据降维方法。它可以通过线性变换将原始数据变换为一组各维度线性无关的表示,以此来提取数据的主要线性分量。 向量的投影现有两个任意不共线向量$\vec{u}, \vec{v}$,将$\vec{u}$投射到$\vec{v}$上 投影后,可以得到两个正交向量 \vec{u}' · (\vec{u} - \

CMake编译库文件 | LOUIS' BLOG

https://louishsu.xyz/2019/01/05/Cmake%E7%BC%96%E8%AF%91%E5%BA%93%E6%96%87%E4%BB%B6/

前言库文件即源代码的二进制文件,我们通常把一些公用函数制作成函数库,供其它程序使用。函数库分为静态库和动态库两种。静态库在程序编译时会被连接到目标代码中,程序运行时将不再需要该静态库;动态库在程序编译时并不会被连接到目标代码中,而是在程序运行是才被载入,因此在程序运行时还需要动态库存在。 编译以DarkNet为例,我们将其源代码编译成.a静态库文件。 下载源码 YOLO: Real-Time

SSD: Single Shot MultiBox Detector | LOUIS' BLOG

https://louishsu.xyz/2019/09/02/SSD-Single-Shot-MultiBox-Detector/

IntroductionSSD主要做了以下工作 设计了one-stage检测算法,比同样是one-stage的YOLOv1更快更准确,相比较Faster R-CNN等two-stage检测算法,在不降低准确率的情况下速度更快; 其核心是用小卷积核,对特征图进行卷积运算,通过一系列的固定回归框进行预测; 用不同尺度的特征图产生不同尺度的预测,并且明确指定多种纵横比; 可进行端到端训练,即使是低分辨

【数据结构】二叉树及其他树 | LOUIS' BLOG

https://louishsu.xyz/2020/02/29/%E3%80%90%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84%E3%80%91%E4%BA%8C%E5%8F%89%E6%A0%91%E5%8F%8A%E5%85%B6%E4%BB%96%E6%A0%91/

树定义:一棵树$t$是一个非空的有限元素的集合,其中一个元素为根(root),其余元素组成$t$的子树。根据树的形态,有如下术语:孩子(child)、父母(parent)、兄弟(sibling)、孙子(grandchild)、祖父(grandparent)、祖先(ancestor)、后代(descendent)等等。树中没有孩子的元素称作叶子(leaf)。 树的另一常用术语为级(level)。树根

【数据结构】栈与队列 | LOUIS' BLOG

https://louishsu.xyz/2020/02/21/%E3%80%90%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84%E3%80%91%E6%A0%88%E4%B8%8E%E9%98%9F%E5%88%97/

栈定义及抽象数据描述定义:栈(stack)是一种特殊的线性表,其插入(aka. 入栈、压栈)和删除(aka. 出栈、弹栈)操作在表的同一端进行,即后进先出(last-in-first-out, LIFO)。两端称作栈顶(top)、栈底(bottom)。 抽象数据描述:1234567891011抽象数据类型 stack{ 实例: linearList; 操作:

Feedforward Neural Network | LOUIS' BLOG

https://louishsu.xyz/2018/10/20/Feedforward-Neural-Network/

前言前馈神经网络是一种最简单的神经网络,各神经元分层排列。每个神经元只与前一层的神经元相连。接收前一层的输出,并输出给下一层.各层间没有反馈。是目前应用最广泛、发展最迅速的人工神经网络之一,既可以用于解决分类问题,也可以用于解决回归问题。 简介前馈神经网络也叫作多层感知机,包含输入层,隐含层和输出层三个部分。它的目的是为了实现输入到输出的映射。 y = f(x;W)由于各层采用了非线性激活函数,

深度学习框架darknet【一】——简单使用 | LOUIS' BLOG

https://louishsu.xyz/2019/12/08/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E6%A1%86%E6%9E%B6darknet%E3%80%90%E4%B8%80%E3%80%91%E2%80%94%E2%80%94%E7%AE%80%E5%8D%95%E4%BD%BF%E7%94%A8/

前言目前可用于深度学习的著名框架有 tensorflow pytorch keras theano caffe … 这些给广大调参狗带来便利,但不利于学生党理解底层实现,例如神经网络的BP算法。 darknet是C语言实现的深度学习开源代码,细细品读,收获颇丰,开源**! 附上官网链接和Github地址 YOLO: Real-Time Object Detection pjreddie/d

mAP | LOUIS' BLOG

https://louishsu.xyz/2019/05/26/mAP/

前言本文介绍一种目标检测任务的评价指标mean Average Precison(mAP),有以下几个重点 如何绘制Precision-Recall曲线; 如何用插值方法计算Average Precison; 理解目标检测中mAP的计算; Precision, Recall, Average Precision计算方法以上定义查看Metrics/分类(classification)评估指标,计

Batch Normalization | LOUIS' BLOG

https://louishsu.xyz/2019/08/27/Batch-Normalization/

前言深度学习网络可通过mini-batch随机梯度下降的方式进行优化,然而在优化过程中,存在梯度消失、收敛不稳定的问题。 原理机器学习中,假定训练数据与测试数据独立同分布(independent and identical independent),当输入数据进行白化操作后,可使模型收敛速度加快,这被称作Covariate Shift。 而在神经网络内部,各层的特征图数据分布不均匀,称为Inter

PCA and LDA with Kernel | LOUIS' BLOG

https://louishsu.xyz/2019/09/05/PCA-and-LDA-with-Kernel/

前言核函数可将数据进行升维,在更高维度的空间进行数据分析,可以将线性不可分问题转换为线性可分问题,关于核函数,详细可查看Support Vector Machine 2.2核技巧。在PCA与LDA中分别介绍了主成分分析与线性鉴别分析,但这两种均为线性方法,本文利用核技巧将数据映射到高维空间,然后再用两种降维方法进行降维。 先升维再降维! 原理假设有$M$个$N$维样本组成数据矩阵$X_{N \ti

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.