使用强大的服务器跑Deep Learning深度学习

1.创建一台云服务器

注：硬盘选大点，机器学习数据大的很，建议50G起步，视频里使用的是Vultr云服务器。

不清楚如何创建云服务器的看我这个视频的后半段

服务器准备工作：

以debian/ubuntu举例

#更新系统
sudo apt update && sudo apt upgrade -y

#安装gcc等编译器用于开发环境
sudo apt install build-essential

#安装python 版本按需调整
sudo apt install python3.9

2.安装miniconda

miniconda官网

复制安装链接

到服务器上wget 链接

然后bash 运行下载下来的脚本安装文件

初始化后，再输入bash就进入miniconda的base环境了

3.配置miniconda环境

# 创建一个名字叫newname的新环境，指定python版本，安装pip包管理工具
conda create -n newname -y python=3.10 pip

# 激活环境
conda activate newname

新环境里安装你需要的包

这一步，国内的服务器请换源，不然速度太慢，换源可以看我这个教程：

如何给linux系统换源(用于大陆服务器加速)

pip install jupyter torch torchvision

4.本地连接服务器的jupyter notebook

本地终端用ssh，把服务器8888端口映射到本机8888端口：

ssh -L8888:localhost:8888 root@ip

运行jupyter notebook（如何后台运行在‘进阶’部分）：

jupyter notebook

得到一个链接，复制到本地电脑，打开即可开始使用

大功告成

放到Jupyter Notebook文件里检查服务器有没有GPU：

import torch

if torch.cuda.is_available():
    # 获取 GPU 数量
    num_gpus = torch.cuda.device_count()
    print(f"Number of available GPUs: {num_gpus}")
else:
    print("CUDA is not available. No GPUs detected.")

检查服务器有什么GPU：

!nvidia-smi

进阶

1. 后台运行

如果你需要让jupyter notebook在后台稳定运行，不会随着ssh连接中断而停止，用下面命令启动：

nohup jupyter notebook --allow-root > jupyter.log 2>&1 &

（后台启动完查询登录地址：jupyter server list）

2. 终止进程

用ps -a, 可以显示这个进程的pid.
kill -9 pid 终止进程

1.创建一台云服务器

2.安装miniconda

3.配置miniconda环境

4.本地连接服务器的jupyter notebook

留下评论取消回复

Trending now