为啥要卸载cuDNN?先搞清楚原因
你可能在想,好好的cuDNN为啥要卸载呢?其实原因挺多的。比如升级显卡驱动时,旧版cuDNN不兼容,系统会报错;或者你装错了版本,导致深度学习框架像TensorFlow或PyTorch跑不起来;再或者单纯想清理空间,因为cuDNN文件可不小。我见过不少人折腾半天,最后发现是cuDNN版本冲突惹的祸。这时候,彻底卸载再重装,比硬撑强多了。记住,卸载前备份重要数据,别手滑把其他库也删了,那可就麻烦大了。

准备工作:别急着动手,先做这些
卸载前得准备好,不然容易出乱子。关掉所有用到GPU的程序,比如训练模型的任务,否则文件锁住删不掉。打开终端,用nvidia-smi命令检查GPU使用情况,确保没进程在跑。接着,备份你的工作环境:如果用了虚拟环境如conda,先导出配置;没用的,记下关键路径。确认你有sudo权限,不然卸载命令会卡壳。我建议再跑个df -h看看磁盘空间,卸载cuDNN能腾出几百MB到几GB呢!
小贴士:卸载前拍个系统快照,用Timeshift或LVM,万一出问题能秒回滚。
步骤一:检查已安装的cuDNN版本
先搞清楚装了啥版本,别瞎删。打开终端,输入:
dpkg -l | grep cudnn
这命令会列出所有cuDNN相关包,比如libcudnn8或libcudnn-dev。输出可能像这样:
- ii libcudnn8 8.9.4.25-1+cuda12.2 amd64 cuDNN runtime libraries
- ii libcudnn-dev 8.9.4.25-1+cuda12.2 amd64 cuDNN development files
记下版本号和包名,后面卸载要用。如果没输出,说明可能手动安装的,得换方法查。试试find /usr -name "*cudnn*"搜文件。这一步别跳过,不然卸载不干净。
步骤二:用APT工具卸载cuDNN库
这是最省事的法子,适合用apt装的cuDNN。在终端跑:
sudo apt-get purge libcudnn*
命令里的*是通配符,删掉所有cudnn开头的包。系统会问确认,输入y就行。完成后,顺手清空缓存:
sudo apt-get autoremove
sudo apt-get clean
autoremove删掉依赖的废包,clean清下载缓存。如果提示包不存在,可能你从源码装的,直接跳下一步。我遇到过apt报错,通常是权限问题,加sudo就搞定。
步骤三:手动清理残留文件和目录
APT卸载可能留尾巴,手动清理才彻底。先删CUDA目录下的cuDNN文件:
sudo rm -rf /usr/local/cuda/lib64/libcudnn*
sudo rm -rf /usr/local/cuda/include/cudnn.h
再检查其他常见藏身地:
/usr/lib/x86_64-linux-gnu/:删掉带cudnn的so文件/etc/alternatives/:移除cudnn软链接
用sudo updatedb更新索引,然后locate cudnn搜残留,见一个删一个。别动非cuDNN文件!清理后重启系统,让变更生效。
步骤四:验证卸载是否成功
卸载完得确认干净了,不然重装会冲突。先跑检查命令:
dpkg -l | grep cudnn
如果没输出,说明包删光了。接着测试文件是否存在:
ls /usr/local/cuda/lib64/libcudnn*
提示”No such file”就对了。试试导入cuDNN:开Python,输入:
import ctypes
ctypes.CDLL('libcudnn.so')
如果报错”libcudnn.so: cannot open shared object file”,恭喜你,卸载成功!反之,得回步骤三再扫一遍。
常见问题与解决办法
卸载时难免踩坑,这里列几个典型问题:
- 报错”Permission denied”:命令前漏了sudo,或者文件被占用。用
lsof | grep cudnn查占用进程,kill掉再删。 - 卸载后CUDA不能用:可能误删其他库。从NVIDIA官网重装CUDA Toolkit,选对应版本。
- 残留文件找不到:装过多个CUDA版本?检查
/usr/local/下的cuda-xx.x目录,手动清理。
如果还不行,去NVIDIA论坛或Stack Overflow搜错误码,社区大神多。记住,卸载cuDNN不影响显卡驱动,别瞎折腾驱动模块!
内容均以整理官方公开资料,价格可能随活动调整,请以购买页面显示为准,如涉侵权,请联系客服处理。
本文由星速云发布。发布者:星速云。禁止采集与转载行为,违者必究。出处:https://www.67wa.com/150308.html