logo
Loading...

執行訓練深度學習模型程式碼時出錯 - Cupoy

執行以下程式碼時epochs = 20@epochs epochs Flux.train!(loss...

執行訓練深度學習模型程式碼時出錯

2020/05/19 下午 06:45
Julia程式語言討論版
徐威銓
觀看數:5
回答數:3
收藏數:0

執行以下程式碼時

epochs = 20

@epochs epochs Flux.train!(loss, params(model), train, ADAM(0.005), cb=throttle(evalcb, 10))

出現以下錯誤:

在此之前的程式碼都有正常執行,想了解問題所在及處理方法,謝謝。

回答列表

  • 2020/05/20 下午 10:34
    杜岳華
    贊同數:1
    不贊同數:0
    留言數:1

    請確定你的 CuArrays 及 CUDAnative 套件有安裝完整,並且可以用以下程式碼測試。

    using CuArrays

    X = cu(rand(3, 3))

    X*X'

    測試通過正常運作後,請跟 Flux 一同使用。

  • 2020/05/21 上午 07:37
    JJLai
    贊同數:2
    不贊同數:1
    留言數:0

    這個問題我也有遇到

    在沒有GPU的電腦運作是正常的

    但在有GPU的電腦就會出現這個問題

  • 2020/05/21 下午 09:42
    Sans
    贊同數:1
    不贊同數:0
    留言數:2

    Hi

    我有遇到一樣的錯誤訊息

    原始環境:

    KUbuntu 18.04 LTS, Nvidia driver 390.x, cuda 9, cudnn 9.0


    後來解決的過程如下:

    1. 更新Nvidia driver至440.33.01 (可以直接裝cuda 10.2附的)

    2. 安裝cuda 10.2 + cudnn 10.2

    3. 重裝CuArrays

    4. pkg > build CuArrays <---我沒有證據,但懷疑套件在第一次build的時候會去吃當時的cuda,然後cuda更新時不會自動rebuild。總之以防萬一我有做這步驟。


    然後目前是可以正確在GPU模式使用CNN的。


    附一下目前各套件版本:

    julia: 1.4.1

    Flux: 0.10.4

    Zygote: 0.4.20

    CUDAapi: 4.0.0

    CuArrays: 2.2.0