💒 CNN Mimarisi

CNN Notasyonu

ConvNet

Convolutional Neural Network yerine bu kısaltılmış ad kullanılmakta

ConvNet Hyperparametreleri

Parametre

Terim

Açıklama

$f$

Filter

Filtre boyutu

$s$

Stride

Adım sayısı

$p$

Padding

Doldurma miktarı

$n_{filter}$

# of filter

Filtre sayısı

ConvNet Örneği

Pooling Layer

Çok derin ağlarda avg pooling diğerlerinde max pooling kullanılır

Pooling

Açıklama

Max Pooling

En büyük pixel değerini alır

Avarage Pooling

Pixellerin ortalamasını alır

Max Pooling

  • En belirgiin özellikleri ortaya çıkarır

  • Filtredeki en büyük pixeli alır

  • Öğrenme olmaz, sadece işlem hızını etkiler

    • Parametre ve gradient descent yok

    • Sadece hyperparametreler var

⚠ Neden iyi çalıştığına dair net bir sebep bilinmiyor.

Neural Network Örneği

  • Parametrelerin (w, b) olmadığı alanlar katman olarak sayılmaz

    • Pooling alanları bir öncesindeki CONV ile ortak katman olarak ele alınır

NN'de Katman Tablosu

  • Activation size ilerledikçe azalır

    • Convolutional işlemlerinin başladığı CONV1 katmanında başlayarak azalır

  • Çok hızlı azalırsa model verimli çalışmaz

Matematiksel Notasyon

  • Superscript $[l]$ denotes an object of the $l^{th}$ layer.

    • Example: $a^{[4]}$ is the $4^{th}$ layer activation. $W^{[5]}$ and $b^{[5]}$ are the $5^{th}$ layer parameters.

  • Superscript $(i)$ denotes an object from the $i^{th}$ example.

    • Example: $x^{(i)}$ is the $i^{th}$ training example input.

  • Lowerscript $i$ denotes the $i^{th}$ entry of a vector.

    • Example: $a^{[l]}_i$ denotes the $i^{th}$ entry of the activations in layer $l$, assuming this is a fully connected (FC) layer.

  • $n_H$, $n_W$ and $n_C$ denote respectively the height, width and number of channels of a given layer. If you want to reference a specific layer $l$, you can also write $n_H^{[l]}$, $n_W^{[l]}$, $n_C^{[l]}$.

  • $n{H{prev}}$, $n{W{prev}}$ and $n{C{prev}}$ denote respectively the height, width and number of channels of the previous layer. If referencing a specific layer $l$, this could also be denoted $n_H^{[l-1]}$, $n_W^{[l-1]}$, $n_C^{[l-1]}$.