使用强大的服务器跑Deep Learning深度学习

1.创建一台云服务器

注:硬盘选大点,机器学习数据大的很,建议50G起步,视频里使用的是Vultr云服务器

不清楚如何创建云服务器的看我这个视频的后半段

服务器准备工作:

以debian/ubuntu举例

#更新系统
sudo apt update && sudo apt upgrade -y

#安装gcc等编译器用于开发环境
sudo apt install build-essential

#安装python 版本按需调整
sudo apt install python3.9

2.安装miniconda

miniconda官网

复制安装链接

到服务器上wget 链接

然后bash 运行下载下来的脚本安装文件

初始化后,再输入bash就进入miniconda的base环境了

3.配置miniconda环境

# 创建一个名字叫newname的新环境,指定python版本,安装pip包管理工具
conda create -n newname -y python=3.10 pip

# 激活环境
conda activate newname

新环境里安装你需要的包

这一步,国内的服务器请换源,不然速度太慢,换源可以看我这个教程:

pip install jupyter torch torchvision

4.本地连接服务器的jupyter notebook

本地终端用ssh,把服务器8888端口映射到本机8888端口:

ssh -L8888:localhost:8888 root@ip

运行jupyter notebook(如何后台运行在‘进阶’部分):

jupyter notebook

得到一个链接,复制到本地电脑,打开即可开始使用

大功告成


放到Jupyter Notebook文件里检查服务器有没有GPU:

import torch

if torch.cuda.is_available():
    # 获取 GPU 数量
    num_gpus = torch.cuda.device_count()
    print(f"Number of available GPUs: {num_gpus}")
else:
    print("CUDA is not available. No GPUs detected.")

检查服务器有什么GPU:

!nvidia-smi

进阶

1. 后台运行

如果你需要让jupyter notebook在后台稳定运行,不会随着ssh连接中断而停止,用下面命令启动:

nohup jupyter notebook --allow-root > jupyter.log 2>&1 &

(后台启动完查询登录地址:jupyter server list)

2. 终止进程

  • ps -a, 可以显示这个进程的pid.
  • kill -9 pid 终止进程

分享你的喜爱

留下评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注