Dataset oluştuturken random_state durumu hakkında bilgisi olan var mı?


#1

Arkadaşlar dataset oluştururken random_state değeri 42 olarak alıyoruz genelde bunun özel bir nedeni varmı? ve bence bu değer sonuçları çok etkiliyor, bunu kaldırdığımızda veriyi split etmiyor bilgisi lan varsa paylaşırsa sevinirim.


#2

random_state değeri random number generatorı başlatmak için kullanılır. Eğer bu değer set edilmezse random number generator random bir state değeri kullanır. Sabit bir değer belirleyerek kodun her çalıştırılmasında aynı sayı dizisinin belirlenmesi sağlanır. bu da verilerin her seferinde aynı train ve test kümelerine bölünmesini sağlar. Böylelikle farklı zamanlarda çalıştırdığınız kodu aynı sonuçlar elde edecek şekilde ayarlamış olursunuz.

42 değerinin özel bir anlamı olduğunu zannetmiyorum. Otostopçunun galaksi rehberinde hayatın anlamını uzun hesaplamalar sonucu 42 bulan süper bilgisayardan esinlenmiş olabilir :slight_smile: Yani random_state değerine ne atandığından çok sabit bir değer atanması önemli. Böylelikle kodunuzu çalıştırdığınız her seferinde aynı random sayı dizileri oluşturacak ve böylelikle sizde farklı zamanlarda çalıştırmanıza ramen tutarlı sonuçlar alacaksınız.


#3

@erayyildiz cevabı yazmış ufak bir ekleme yapayım veri setinin her zaman aynı şekilde bölünmesi sağladığımızda ; ağda yada parametrelerde yaptığımız değişikliğin sonucunu daha sağlıklı görebiliriz.