CNN ile obje sınıflandırma için arkaplan önerisi


#1

Herkese merhaba,

Bir projem için obje sınıflandırma yapmam gerek. ImageNet’ten her sınıf için 500 resim indirdim. 100 tane de sınıflandırma yapacağım tabla üzerinde resim çektim. İlk defa bir model eğiteceğim için aklımda bazı soru işaretleri var. Bu yüzden fikir almak istiyorum. Derinlik algısı olması için çizgiler çektim ama tablayı tamamen boyamam daha iyi bir sonuç verir mi?

İlgilenen herkese şimdiden teşekkür ederim.

Veri setim şu şekilde karma olacak.


#2

Merhaba hocam. Bende sizin projenize benzer bir proje yapmak istiyorum. Projenizin detaylarını ve işlem adımlarını benimle paylaşabilir misiniz? Bilgi sahibi olmak ve konuyu kavrayabilmek için rica ediyorum. İyi çalışmalar diliyorum.


#3

Merhabalar,

Projenizde hedeflediğiniz hatanın (base error) ne olduğuna göre değişiklik gösterir. Human-level olarak kabul ediyorsanız ki bu örnekte %0 olarak ifade edebiliriz. Buradan hareketle model performansını regularization, NN architecture vs. gibi parametrelerle eğitim kümesini de göz önünde bulundurarak hedefe yaklaştırmanız gerekir.

Derinlik algısı olması için çizgiler çektim, tablayı tamamen boyamam daha iyi bir sonuç verir mi?

Biz algılıyorsak modelde algılayabilmeli fakat beyaz zeminde daha net sonuç alabilirsiniz.

Başarılar,
Murat


#4

"Derinlik algısı olması için çizgiler çektim ama tablayı tamamen boyamam daha iyi bir sonuç verir mi?"

Bu kısmı biraz daha açabilir misiniz? Nesneyi tanıması için arka plan neden önemli? Bu hususa değinen makale vs. varsa paylaşabilir misiniz? Şimdiden teşekkürler.


#5

En temel nesne ve yüz tanıma algoritmalarından olan Viola-Jones dan yola çıkarsak, öğrenme sürecinde haar-like features kullanılmaktadır. Bu algoritmanın temelinde renkli fotoğrafları griye çevirerek (RGB 3 kanaldan 1 kanala düşürerek) hedef doğrultusunda eğittiğimiz algoritmayla tanımlama yapmaktır.

Öğrenme sürecinde bağlantıda paylaştığım öznitelik çıkaran flltreler kullanılır. Bu filtreler siyah ve beyaz kısımdan oluşmuştur. Resim üzerinde denk geldiği siyah kısmın ortalamasından beyaz kısmın ortalaması çıkarılır. Böylece devam ederek belirli thresholdlar tanımlanarak nesne öğrenmesi tamamlanır.

Eğer kendi algoritmanızda dinamik bir arkaplanınız yoksa, düz bir arkaplan kullanmanız daha doğru olacaktır. Dinamik veya belirli bir renk geçişleriyle olan arka plan kullanmak istiyorsanız bunu algoritmanıza arkaplan olarak öğretmeniz ve cost fonksiyonu da bu doğrultuda ele almanız modelinizde başarıyı arttıracaktır.

Murat