8wDlpd.png
8wDFp9.png
8wDEOx.png
8wDMfH.png
8wDKte.png

Tensorflow、CUDA、cuDNN 上的机器学习模型不起作用

Peter Constable 2月前

28 0

我正在尝试在 Conda 环境中的 Jupyter Notebooks 上运行 ResNet152。这是我的代码:从 tensorflow.keras.applications 导入 ResNet50、ResNet101、ResNet152、InceptionResNetV2、DenseNet12...

我正在尝试在 Conda 环境中的 Jupyter Notebook 上运行 ResNet152。这是我的代码:

from tensorflow.keras.applications import ResNet50, ResNet101, ResNet152, InceptionResNetV2, DenseNet121
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D, Activation, BatchNormalization
from tensorflow.keras import mixed_precision, layers, models
import tensorflow as tf
from tensorflow.keras.optimizers.schedules import ExponentialDecay
from tensorflow.keras.optimizers import Adam, RMSprop

mixed_precision.set_global_policy('mixed_float16')

base_model = ResNet152(weights='imagenet', include_top=False, input_shape=(256, 256, 3))


for layer in base_model.layers:
    layer.trainable = True 

pooling_layer = layers.GlobalAveragePooling2D()(base_model.output)  # GlobalAveragePooling2D layer
output_layer = layers.Dense(1, activation='sigmoid', name='output_layer')(pooling_layer)

model = Model(inputs=base_model.input, outputs=output_layer)

initial_learning_rate = 0.001
lr_schedule = ExponentialDecay(
    initial_learning_rate,
    decay_steps=50,  # Adjust the decay steps as needed
    decay_rate=0.9,     # Adjust the decay rate as needed
    staircase=False)

optimizer = Adam(learning_rate=lr_schedule)

model.compile(
    optimizer=optimizer,
    loss='binary_crossentropy',
    metrics=['accuracy', tf.keras.metrics.Precision(), tf.keras.metrics.Recall(), tf.keras.metrics.AUC(name='auc')]
)

model.summary()

os.environ['CUDA_VISIBLE_DEVICES'] = '0'
history = model.fit(dataset_batched_withoutnames, epochs=5)

我收到以下错误:

DNN library is not found.
     [[{{node model/conv1_conv/Conv2D}}]] [Op:__inference_train_function_55822]

(有一个长框,但没有将其全部复制粘贴)

我回去降级了我的 Tensorflow、CUDA 和 cuDNN。我现在使用的是 CUDA 11.2、cuDNN 8.1.0 和 Tensorflow 2.10.0

我回到我的路径并清理了所有内容,并将以下所有内容添加到路径中

这为什么不起作用?

帖子版权声明 1、本帖标题:Tensorflow、CUDA、cuDNN 上的机器学习模型不起作用
    本站网址:http://xjnalaquan.com/
2、本网站的资源部分来源于网络,如有侵权,请联系站长进行删除处理。
3、会员发帖仅代表会员个人观点,并不代表本站赞同其观点和对其真实性负责。
4、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
5、站长邮箱:yeweds@126.com 除非注明,本帖由Peter Constable在本站《tensorflow》版块原创发布, 转载请注明出处!
最新回复 (0)
  • 谢谢!我最终创建了一个全新的环境并按照您的建议进行了安装。这解决了问题。谢谢!!!!

  • DNN library is not found. 通常意味着 CUDA 未正确安装或安装了错误的 CUDA 依赖项。作为第一步,您可以通过 nvidia-smi 在终端中运行来检查安装是否正常。

  • 我运行它,它显示 CUDA 12.5。我确实明确降级到 CUDA 11.2。当我运行 NVCC--version 时,它显示版权所有 (c) 2005-2020 NVIDIA Corporation 构建于 Mon_Nov_30_19:15:10_Pacific_Standard_Time_2020 Cuda 编译工具,版本 11.2,V11.2.67 构建 cuda_11.2.r11.2/compiler.29373293_0 .... 我的 nvidia-smi 显示这个有什么原因吗?

  • nvidia-smi 仅显示您安装的图形驱动程序所支持的最高 cuda 版本 - 它不显示实际(甚至)安装的内容。nvidia-smi 只会告诉您已正确安装了兼容 cuda 的驱动程序。

返回
作者最近主题: