Logistic regression: neden w'nun transpozunu aliyoruz?


#1

bu y degerini tahmin etmek icin kurdugumuz ve sigmoid uyguladigimiz z fonksiyonunu bir linear regresyon seklinde duzenlemeyi anliyorum, ancak notasyonun degiskene dayali parcasini anlamis degilim.

wTx notasyonu bana ne anlatmali? w kullanacaksak niye x var? w’nun tranzpozu niye aliniyor?

Tesekkurler,
Evrim

image


#2

matrix çarpımında ( dot product ) boyutları doğru ayarlamayla ilgili birşey bu.
matrix çarpımında ( dot product ) ikiside sütun ( nx1 )olarak ifade edilen 2 matrixi çarpamayız. Bu yüzden ilk matrixin tranpose’unu alarak onu satır matrixi ( 1 x n ) olarak ifade ederiz. böylece ( w dot x ) (w^T dot x ) şeklinde ifade edilir. sonuç w1x1 + w2x2 + … + b olur ve bunu sigmoid fonksiyonun icine sokarak 0 1 arasında bi değer elde ederiz.

daha detaylı bir anlatım:
https://mathinsight.org/dot_product_matrix_notation

W neden var ? W nin değerlerini bilmiyoruz inputlarımıza göre output cıktısını tahmin etmeye calisiyoruz. Ççok kaba olarak w ( weigthler ) bizim hangi X değerlerimizin outputta daha faydalı bir değer kattığını gösteriyor diyebiliri, bir inputun weight değeri yüksekkse cıkışa onun katkısı yüksek olacaktır diyebiliriz). , Birbirinden ayrı x değerlerinin cıkışa ne kadar etki ettiğini ( featureların ) W değerlerini tune ederek buluyoruz yani öğreniyoruz optimizasyon algoritmaları ile. ( gradient descent opt. + loss function )


#3

tesekkur ederim, cagatay. neden bilmiyorum, ilk izledigimde w’lari agirlik olarak verdigini dusunmustum (belki tum videolari kesintisiz izledigim icin). anlamadigim yerelere bakmak icin geri dondugumde agirlik olduklari fikrini tamamen kafamdan silmisim.

transpoz konusunda da sanki iki sayi carpimi gibi yaklastim kafamda hep, matriks olduklarini tamamen goz ardi ettim.

Tekrar tesekkur,
Evrim