自建AI环境

轩辕暗神 5天前 ⋅ 27 阅读

1、准备

操作系统这次采用Ubuntu,兼容性好,生态完善

python版本,这里采用python3.10

机器,这里选择阿里云按量付费

Ubuntu 24.04 64位

CPU

 ecs.gn7i-c16g1.4xlarge

内存

 16 核(vCPU)60 GiB

GPU:NVIDIA A10

2、安装系统后准备:

2.1、安装基本工具

sudo apt update && sudo apt upgrade -y
sudo apt install -y build-essential zlib1g-dev libncurses5-dev libgdbm-dev libnss3-dev libssl-dev libreadline-dev libffi-dev libsqlite3-dev wget libbz2-dev
apt-get install -y wget unzip vim gcc g++  net-tools  telnet curl make openssl libssl-dev zlib1g zlib1g.dev  lrzsz
sudo reboot

2.2、安装python

# 下载
wget https://www.python.org/ftp/python/3.10.18/Python-3.10.18.tar.xz

# 解压
tar -xf Python-3.10.18.tar.xz

# 进入目录
cd Python-3.10.18

# 配置编译选项
./configure --enable-optimizations --prefix=/usr/local/python3.10

# 编译(使用多核加速)
make -j$(nproc)

# 安装(使用 altinstall 避免覆盖系统 python)
sudo make altinstall

2.3、将 Python 3.10 添加到 PATH

echo 'export PATH="/usr/local/python3.10/bin:$PATH"' >> ~/.bashrc
source ~/.bashrc

2.4、验证是否生效

python3.10 --version
pip3.10 --version

3、安装其他依赖

✅ 推荐:AI 模型运行常用依赖列表(Ubuntu 系统) 以下是一个全面且实用的依赖清单,适用于:

本地运行 LLM(如 Qwen、Llama、ChatGLM) 图像识别(CNN、Stable Diffusion) 自然语言处理(NLP) 使用 HuggingFace、LangChain、vLLM、llama.cpp 等工具

🔧 3.1、基础编译与系统依赖(强烈建议安装)

sudo apt update

sudo apt install -y \
    build-essential \
    cmake \
    pkg-config \
    libffi-dev \
    libssl-dev \
    libbz2-dev \
    libreadline-dev \
    libsqlite3-dev \
    libncurses5-dev \
    libnss3-dev \
    libgdbm-dev \
    libdb5.3-dev \
    liblzma-dev \
    zlib1g-dev \
    libcurl4-openssl-dev \
    libopenblas-dev \
    libatlas-base-dev \
    libjpeg-dev \
    libpng-dev \
    libfreetype6-dev \
    libxft-dev \
    libharfbuzz-dev \
    libfribidi-dev \
    libxcb1-dev \
    git \
    wget \
    curl \
    unzip \
    vim \
    htop \
    tmux \
    screen \
    python3-pip \
    python3-dev \
    python3-venv

⚠️ 这些是编译 Python 包(如 numpy, pillow, tokenizers)时经常需要的底层库。

🐍 3.2、Python 常用 AI 相关库(使用 pip 安装)

已安装 python3.10 和 pip3.10,运行:

pip3.10 install --upgrade pip

pip3.10 install --no-cache-dir \
    numpy \
    scipy \
    pandas \
    matplotlib \
    seaborn \
    jupyter \
    notebook \
    ipython \
    scikit-learn \
    scikit-image \
    opencv-python-headless \
    pillow \
    requests \
    tqdm \
    psutil \
    GPUtil \
    tensorboard \
    pyyaml \
    omegaconf \
    einops \
    sentencepiece \
    protobuf \
    h5py \
    pydantic

🧠 3.3、深度学习框架(根据需求选择)

✅ 1. PyTorch(推荐用于大多数 AI 模型)
# CPU 版本(无 GPU)
pip3.10 install torch torchvision torchaudio

# 如果你的 ECS 有 NVIDIA GPU(如 vgn5i 型实例),请安装 GPU 版本:
pip3.10 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

🔗 官方安装命令生成器:https://pytorch.org/get-started/locally/

✅ 2. TensorFlow(可选)
pip3.10 install tensorflow-cpu  # CPU 版本
# 或
pip3.10 install tensorflow      # 自动包含 CPU 支持

⚠️ TensorFlow GPU 支持较复杂,需安装 CUDA/cuDNN,建议仅在明确需要时配置。

🤖 3.4、大模型(LLM)相关工具

pip3.10 install \
transformers \
accelerate \
bitsandbytes \
peft \
auto-gptq \
llama-cpp-python \
vllm \
langchain \
langchain-community \
chromadb \
faiss-cpu \
sentence-transformers \
tiktoken \
openai \
zhipuai \
dashscope  # 阿里通义系列 SDK

💡 提示:

llama-cpp-python:可在 CPU 上高效运行 GGUF 格式模型(如 Llama、Qwen)

vllm:高性能 LLM 推理引擎(需 GPU)

dashscope:调用阿里云 Qwen 大模型 API 的官方 SDK

🖼️ 3.5、图像/多模态模型常用库

pip3.10 install \
diffusers \
transformers \
accelerate \
Pillow \
gradio \
streamlit \
flask \
uvicorn \
fastapi

可用于运行:

** Stable Diffusion

  • BLIP / CLIP
  • Qwen-VL(多模态大模型)

🛠️ 3.6、性能监控与调试工具

pip3.10 install \
memory_profiler \
line_profiler \
objgraph \
torchinfo

📦 3.7、虚拟环境管理(推荐使用)

避免依赖冲突,建议为每个项目创建独立环境:

# 创建虚拟环境
python3.10 -m venv ai_env

# 激活环境
source ai_env/bin/activate

# 安装包
pip install torch transformers...

# 退出环境
deactivate

🧩 3.8、可选:安装 Conda(更强大的包管理)

如果你希望更方便地管理不同 Python 版本和依赖,可以安装 Miniconda:

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh

然后使用 conda 安装 AI 包,支持二进制预编译,减少编译错误。

✅ 3.9 总结:你可以一键运行的安装脚本(建议分步执行)

# 1. 系统依赖
sudo apt update && sudo apt install -y build-essential cmake pkg-config libffi-dev libssl-dev libbz2-dev libreadline-dev libsqlite3-dev libncurses5-dev libnss3-dev libgdbm-dev libdb5.3-dev liblzma-dev zlib1g-dev libcurl4-openssl-dev libopenblas-dev libatlas-base-dev libjpeg-dev libpng-dev libfreetype6-dev libxft-dev git wget python3-pip python3-dev

# 2. Python 基础库
pip3.10 install --upgrade pip
pip3.10 install numpy scipy pandas matplotlib scikit-learn opencv-python-headless pillow requests tqdm psutil GPUtil

# 3. 深度学习框架(PyTorch CPU)
pip3.10 install torch torchvision torchaudio

# 4. 大模型工具
pip3.10 install transformers accelerate peft bitsandbytes llama-cpp-python langchain dashscope

📚 3.10 后续建议

使用阿里云通义千问 API(免费额度 + 高性能):

pip install dashscope

文档:https://help.aliyun.com/zh/dashscope/ 本地运行 Qwen 模型:

  • 下载 GGUF 模型(如 qwen1.5-1.8b-gguf)
  • 使用 llama.cpp 或 vLLM 加载 部署 Web 服务:用 Gradio 或 FastAPI 快速搭建界面。

全部评论: 0

    我有话说: