Tensorflow-GPU CuDNN versiyon hatası hakkında


#1

ÇÖZÜLDÜ (cevap yorumlarda)

Yine ben yine Gpu sorunum.
Bu sefer biraz daha farklı bir sorunum var o yüzden yeni konu açtım.

Tensorflow-gpu yükledim.Normal eğitimler üstünde bir sorun çıkmadı. (Lstm cümle üretici)

Fakat resimlerle ilgili olan eğitimler sırasında python çöküyor.
Örnek olarak Tensorflow’un kendi yayınlardığı object detection kodunda ve bir tane deep dream kodunda denedim 2 side çöktü.
Hatayı anlayamadım. Son çare size yazıyorum önceden başına gelen varsa diye
Şimdiden teşekkürler.
Kod çalışmaya başladığında eğitim kısmına gelince çökmeye başlıyor.
En son hata olarak şunu veriyor:

An error ocurred while starting the kernel
2018󈚧󈚿 12:40:38.023805: I C:\tf_jenkins\workspace\rel‑win\M\windows‑gpu\PY\36\tensorflow\core\platform\cpu_feature_guard.cc:140] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2
2018󈚧󈚿 12:40:38.677646: I C:\tf_jenkins\workspace\rel‑win\M\windows‑gpu\PY\36\tensorflow\core\common_runtime\gpu\gpu_device.cc:1212] Found device 0 with properties:
name: GeForce 840M major: 5 minor: 0 memoryClockRate(GHz): 1.124
pciBusID: 0000:08:00.0
totalMemory: 2.00GiB freeMemory: 1.65GiB
2018󈚧󈚿 12:40:38.679949: I C:\tf_jenkins\workspace\rel‑win\M\windows‑gpu\PY\36\tensorflow\core\common_runtime\gpu\gpu_device.cc:1312] Adding visible gpu devices: 0
2018󈚧󈚿 12:40:43.013705: I C:\tf_jenkins\workspace\rel‑win\M\windows‑gpu\PY\36\tensorflow\core\common_runtime\gpu\gpu_device.cc:993] Creating TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 1421 MB memory) ‑> physical GPU (device: 0, name: GeForce 840M, pci bus id: 0000:08:00.0, compute capability: 5.0)
2018󈚧󈚿 12:40:48.036394: E C:\tf_jenkins\workspace\rel‑win\M\windows‑gpu\PY\36\tensorflow\stream_executor\cuda\cuda_dnn.cc:378] Loaded runtime CuDNN library: 7101 (compatibility version 7100) but source was compiled with 7003 (compatibility version 7000). If using a binary install, upgrade your CuDNN library to match. If building from sources, make sure the library loaded at runtime matches a compatible version specified during compile configuration.
2018󈚧󈚿 12:40:48.038495: F C:\tf_jenkins\workspace\rel‑win\M\windows‑gpu\PY\36\tensorflow\core\kernels\conv_ops.cc:717] Check failed: stream‑>parent()‑>GetConvolveAlgorithms( conv_parameters.ShouldIncludeWinogradNonfusedAlgo(), &algorithms)


#2

CuDNN versiyonunuz yanlis. Hatanin onemli kismi surada:

Blok-alıntı
Loaded runtime CuDNN library: 7101 (compatibility version 7100) but source was compiled with 7003 (compatibility version 7000). If using a binary install, upgrade your CuDNN library to match. If building from sources, make sure the library loaded at runtime matches a compatible version specified during compile configuration.

Anladigim kadariyla sizin CuDNN versiyonunuz 7.1 ama tensorflow’u 7.0 ile kurmussunuz. CuDNN 7.0’i kurup environment variable lari dogru ayarlayip onu kullanmasini saglarsaniz sorununuz cozulmus olmali.


#3

Tensorflow, CUDA ve CuDNN versiyonları konusunda bayağı sıkıntılı. Tensorflow’un hangi versiyonunu kullanıyorsan onun dokümantasyonundan gerekli CUDA ve CuDNN versiyonlarına göre kurulum gerçekleştir. Hiç bir şekilde daha güncel ya da eski versiyon kurma. Tensorflow ne istiyorsa onu kur.

Yanlış hatırlamıyosam Tensorflow 1.6 versiyonu (1.7’de değişti mi bilmiyorum) sadece CUDA 9.0 and cuDNN 7 ile çalışıyor.


#4

Evet sorunum çözüldü. Cudnn 7.0.4 ü indirdim. Tekrar teşekkür ederim.


#5

@Utku20, soruların daha sonra arandığında kolay şekilde erişilebilmesi ve anlaşılabilmesi için “Tensorflow-GPU Resim Sorunu” başlığı “[ÇÖZÜLDÜ] Tensorflow-GPU CuDNN versiyon hatası hakkında” şeklinde değiştirildi.