Tensorflow kullanarak Multivariate logistic regression


#1

Merhaba ,

TF kullanarak retail store konum optimizasyonu yapmaya calisiyorum. Elimde 230 tane farklı girdi var bunlara göre 5 magaza tipinden birini ilgili konum gridi bazında belirlemek istiyorum.
Hic boyle bir calisma yapmıs olan var mı ? Veya benzeri bir veri seti ile calisan?

Simdiden Tesekkurler
B.


#2

Merhaba,
Ben sorununuzu çok anlamadım, elinizdeki 230 sample’ı 5 mağaza tipine mi atamak istiyorsunuz ?
Eğer önceden etiketli veriniz yoksa ve 230 mağaza için 5 farklı tip bulacaksanız probleminiz unsupervised learning ve datayı k-means gibi bir algoritma ile cluster etmeyi düşünebilirsiniz.
Ancak elinizde bu 230 dan farklı eğitim için kullanacağınız bir data varsa o zaman Tensorflow’un MNIST verisetindeki tuttoriallerine (https://www.tensorflow.org/versions/r1.0/get_started/mnist/beginners) göz atabilirsiniz. MNIST verisi imge, ancak sınıflandırma problemi çok benzer.
Eğer datadan hem koordinat tahmini hem de sınıf tahmini yapacaksanız, multi task learning problemi ile uğraşıyorsunuz. MTL kısaca aynı datadan, iki veya daha fazla farklı ancak birbirleriyle ilintili olan görevler için öğrenme problemlerine verilen isim. Koordinat tahmini linear veya nonlinear regression problemi olarak incelenebilir(datayı çizdirmek bu noktada non-linear - linear ayrımına karar vermenize yardımcı olabilir). Bu problem için houston emlak veri seti problemlerini inceleyebilirsiniz. Sınıflandırma problemi de logistic regression olarak incelenebilir.


#3

Öncelikle cevabınız icin tesekkur ederim

Özür dilerim doğru anlatmadım sanırım

Öncelikle durum şöyle elimde toplam 250 ye yakın farklı veri tipi var örn. sosyo ekonomik durum, gelir seviyesi, emlak ratingi, ortalama kazanc, urun sahipligi gibi bunları da belirli geoGridlere atayabiliyorum. Diğer taraftan da burada hali hazırda olan bayilerim var çeşitli tiplerde örn. kücük bayi buyuk bayi en buyuk bayi.
Yapmak istedigim TF kullanarak varolan veri boyutlarını ve diger POI dataını kullanıp bu gride hangi bayiyi acmak daha iyi olur kararını vermek
Ya da baska bir query ise örn kadıkoye kucuk bayi mi acayim orta bayi mi acayim?

Bu noktalar cercevesinde Tf kullanmak ne derece etkin olur acaba?


#4

Veri tipi olarak bahsettiğin şeyler “feature” olmasın (hadi muhteşem türkçe sevdalılarını üzmeyip “öznitelik” diyelim)?

Benim anladığım (n, 250)'lik bir datasetin var (where n=toplam data sayısı). Bunların kategori karşılığı olarak da bayii büyüklükleri var (ki bu da tahminim 5 tane = en küçük/küçük/orta/büyük/en büyük şeklinde).

Yazdıklarından çıkarımım, hardcore structured bir data üzerinde çalıştığın için, tensorflowla fanteziye girmek yerine LightGBM gibi gradient boosting algoritmalarını dene. Şayet amacın en başarılı modeli oluşturmaksa, bu algoritmanın parametreleriyle oynayıp güçlü bir baseline çıkartabilirsin. Sonuçlar seni tatmin etmezse model stacking’e girersin illa tensorflowu kullanmak istiyorsan. Onda da kalkıp cnn/lstm gibi senin amacına uymayacak yöntemler yerine dümdüz multi-layer neural network yaratman faydalı olacaktır. Sonra iki modelden gelen sonuçları ensemblelayıp, predictiona yürürsün.