Cost Function'da 1/2m neyi ifade eder?

coursera

#1

Merhabalar,
Andrew Ng courseradaki machine learning derslerinde cost function u anlatırken formul olarak şunu verdi.
( 1/2m ) * ∑ ((h(xi)-yi)^2)
Bu formulde sağ kısım tamam ancak solda neden 2m gibi bir sabite böldüğümüzü anlayamadım çok basit bir şey muhtemelen ama açıklayabilecek var mı?

edit : 1/m kısmının ortalama almak için olduğunu öğrendim ancak 1/2 kısmı hala aklıma yatmadı :slight_smile:


#2

Cost function minimizasyonu sirasinda bastaki sabit bir carpan minimizasyon sonucunu etkilemez. Bu nedenden dolayi 1/2 pratikte bir onem teskil etmemektedir (m de bir onem teskil etmemektedir, ortalamanin minimumu ile toplamin minimumu da aynidir).

Ancak mukemmelliyetci bir acidan yaklasilir ve Gaussian bir model ile cross entropy hesapladigimizi varsayarsak E[-log P(x)] ~ c/m + ( 1/2m ) * ∑ ((h(xi)-yi)^2) gibi bir ifadeye tekabul eder ki bu da verinin bu modelle kodlandiginda gercege gore ortalama kac bit veya nat (logaritmanin tabanina gore secilir) hata yaptigimizi ifade eder (up to an additive constant - bunu burada aciklamak zaman alir).


Hata neden 1/2 ile çarpılıyor?
#3

Bu konu son cevaptan 60 dakika sonra otomatik olarak kapatıldı. Yeni cevap girilmesine izin verilmiyor.