引出

 在kaggle的introduction to deep learning 中谈到了卷积的概念,下面谈谈个人对卷积的初步理解。

在图像处理中的卷积

 卷积可以当作一种信息混合的手段,考虑我们现在有两个装满信息的桶,现在我们将两个桶的信息全部倒入一个新桶中进行某种规律的混合,而卷积就可以看作是这种混合的手段。
 而在对图像做卷积处理中,我们需要注意两个对象,一个是原图像,由三个矩阵构成——RGB通道,矩阵中每个元素都是大小在0-255之间的一个整数。而另一个对象则是卷积核有时候也称作滤波器(kernel),是一个单浮点数矩阵。可以将卷积核考虑成一种搅拌图像的方法,经卷积核混合之后的原图像就会变成一副修改后的图像,在深度学习中经常被叫做feature map。

边缘检测卷积核的效果

 而针对不同的卷积核,原图像会被混合成一种不同的图像,而不同的图像都体现出不同的特征,所以在这里,卷积核可以被理解成一种图像的特征提取器。对于一副图像,提取特应的特征就可以应用对应的卷积核.
 下面可以演示一下如何通过卷积来混合这两种信息。一种方法是从图像中取出一个与卷积核大小相同的块——假设核为3\times3,原图像为100\times100,那么我们从图像中取出一个3\times3的一块,执行矩阵的点乘法再将所有值相加,类似向量内积,从而得到feature map中的一个pixel(像素),当这个pixel处理完了之后,我们可以重新在原图中选取一个3\times3的一块,再次与卷积核做矩阵类点乘法,从而又得到feature map的另一个pixel,就这样一直在原图像中选取直到没有其他的3\times3的一块可以取,这样我们就得到一张feature map,而这个feature map的大小是98\times98(图像大小-卷积核大小+1),至此,我们得到一张新的feature map。

RAM是输入图片,Buffer是feature map

 在这里有个正则化因子m,这里m的值为kernel的大小为9,目的是为了保证输入图像和feature map的亮度相同。
 总而言之,卷积可以看成提取特征的一种方法,而卷积核则是提取特定特征的一种工具。


1 条评论

PPT学习笔记三 – Rb's Hanpy Blog · 2021年7月29日 上午10:37

[…]   卷积神经网络的计算在这里就不做赘述,可以参考我之前的介绍卷积的博文👉传送门👈。 […]

发表评论