logo
Loading...

CUDA驅動程式設定問題 - Cupoy

["CUDA_VISIBLE_DEVICES"]不管怎麼設定包含""、"0"、"0,1,2,3"都是...

ml100-2,ml100-2-d78

CUDA驅動程式設定問題

2019/10/02 下午 10:06
機器學習共學討論版
陳裕興
觀看數:48
回答數:2
收藏數:0
ml100-2
ml100-2-d78

["CUDA_VISIBLE_DEVICES"]不管怎麼設定包含""、"0"、"0,1,2,3"都是出現下圖

跑出來的結果均在350 ~ 400 sec左右,相關設定的均有設定,請問一下這行指令要該如何設定才會跑出應有的結果呢? 另外如何使用CPU去跑而非GPU跑呢




回答列表

  • 2019/10/04 上午 11:46
    Justin Liao
    贊同數:0
    不贊同數:0
    留言數:0

    看起來是顯卡驅動裝好,但anaconda吃不到GPU,可以參考下面這篇

    https://blog.csdn.net/colourful_sky/article/details/78524382

    可能的原因很多,像是顯卡驅動版本、python 版本、路徑設定等等

  • 2019/10/09 上午 10:18
    Seanyu.TW
    贊同數:1
    不贊同數:0
    留言數:0

    看起來你的版本設定上都是相容的版本,程式再執行的時候也有把 GPU RAM 吃進去,然後他也有在動 (Volatile GPU-Util != 0) ,只是程式自己好像不知道吃了多少 RAM 這點有點奇怪,你可以參考 https://stackoverflow.com/questions/44227767/nvidia-smi-does-not-display-memory-usage。

    所以如果跑得很慢的話,可能要再檢查一些比如 data pipeline 是否托慢速度之類的問題,這點你可能要附上程式碼比較詳細了。

    另外關於使用 CPU/GPU 運行,CUDA_VISIBLE_DEVICES = "" 正確的行為是用 Tensorflow-gpu 使用 CPU 運行;CUDA_VISIBLE_DEVICES = "0" 為讓程式看得到第 0 顆的 GPU,如果設為 "0,1" 則可以看到兩顆,但是 Tensorflow 並不會自己使用兩顆,若要平行化運算,則程式要做一些對應的改變。