自建AI环境

1、准备

操作系统这次采用Ubuntu，兼容性好，生态完善

python版本，这里采用python3.10

机器，这里选择阿里云按量付费

Ubuntu 24.04 64位

CPU

 ecs.gn7i-c16g1.4xlarge

内存

 16 核（vCPU）60 GiB

GPU：NVIDIA A10

2、安装系统后准备：

2.1、安装基本工具

sudo apt update && sudo apt upgrade -y
sudo apt install -y build-essential zlib1g-dev libncurses5-dev libgdbm-dev libnss3-dev libssl-dev libreadline-dev libffi-dev libsqlite3-dev wget libbz2-dev
apt-get install -y wget unzip vim gcc g++  net-tools  telnet curl make openssl libssl-dev zlib1g zlib1g.dev  lrzsz
sudo reboot

2.2、安装python

# 下载
wget https://www.python.org/ftp/python/3.10.18/Python-3.10.18.tar.xz

# 解压
tar -xf Python-3.10.18.tar.xz

# 进入目录
cd Python-3.10.18

# 配置编译选项
./configure --enable-optimizations --prefix=/usr/local/python3.10

# 编译（使用多核加速）
make -j$(nproc)

# 安装（使用 altinstall 避免覆盖系统 python）
sudo make altinstall

2.3、将 Python 3.10 添加到 PATH

echo 'export PATH="/usr/local/python3.10/bin:$PATH"' >> ~/.bashrc
source ~/.bashrc

2.4、验证是否生效

python3.10 --version
pip3.10 --version

3、安装其他依赖

✅ 推荐：AI 模型运行常用依赖列表（Ubuntu 系统）以下是一个全面且实用的依赖清单，适用于：

本地运行 LLM（如 Qwen、Llama、ChatGLM）图像识别（CNN、Stable Diffusion）自然语言处理（NLP）使用 HuggingFace、LangChain、vLLM、llama.cpp 等工具

🔧 3.1、基础编译与系统依赖（强烈建议安装）

sudo apt update

sudo apt install -y \
    build-essential \
    cmake \
    pkg-config \
    libffi-dev \
    libssl-dev \
    libbz2-dev \
    libreadline-dev \
    libsqlite3-dev \
    libncurses5-dev \
    libnss3-dev \
    libgdbm-dev \
    libdb5.3-dev \
    liblzma-dev \
    zlib1g-dev \
    libcurl4-openssl-dev \
    libopenblas-dev \
    libatlas-base-dev \
    libjpeg-dev \
    libpng-dev \
    libfreetype6-dev \
    libxft-dev \
    libharfbuzz-dev \
    libfribidi-dev \
    libxcb1-dev \
    git \
    wget \
    curl \
    unzip \
    vim \
    htop \
    tmux \
    screen \
    python3-pip \
    python3-dev \
    python3-venv

⚠️ 这些是编译 Python 包（如 numpy, pillow, tokenizers）时经常需要的底层库。

🐍 3.2、Python 常用 AI 相关库（使用 pip 安装）

已安装 python3.10 和 pip3.10，运行：

pip3.10 install --upgrade pip

pip3.10 install --no-cache-dir \
    numpy \
    scipy \
    pandas \
    matplotlib \
    seaborn \
    jupyter \
    notebook \
    ipython \
    scikit-learn \
    scikit-image \
    opencv-python-headless \
    pillow \
    requests \
    tqdm \
    psutil \
    GPUtil \
    tensorboard \
    pyyaml \
    omegaconf \
    einops \
    sentencepiece \
    protobuf \
    h5py \
    pydantic

🧠 3.3、深度学习框架（根据需求选择）

✅ 1. PyTorch（推荐用于大多数 AI 模型）

# CPU 版本（无 GPU）
pip3.10 install torch torchvision torchaudio

# 如果你的 ECS 有 NVIDIA GPU（如 vgn5i 型实例），请安装 GPU 版本：
pip3.10 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

🔗 官方安装命令生成器：https://pytorch.org/get-started/locally/

✅ 2. TensorFlow（可选）

pip3.10 install tensorflow-cpu  # CPU 版本
# 或
pip3.10 install tensorflow      # 自动包含 CPU 支持

⚠️ TensorFlow GPU 支持较复杂，需安装 CUDA/cuDNN，建议仅在明确需要时配置。

🤖 3.4、大模型（LLM）相关工具

pip3.10 install \
transformers \
accelerate \
bitsandbytes \
peft \
auto-gptq \
llama-cpp-python \
vllm \
langchain \
langchain-community \
chromadb \
faiss-cpu \
sentence-transformers \
tiktoken \
openai \
zhipuai \
dashscope  # 阿里通义系列 SDK

💡 提示：

llama-cpp-python：可在 CPU 上高效运行 GGUF 格式模型（如 Llama、Qwen）

vllm：高性能 LLM 推理引擎（需 GPU）

dashscope：调用阿里云 Qwen 大模型 API 的官方 SDK

🖼️ 3.5、图像/多模态模型常用库

pip3.10 install \
diffusers \
transformers \
accelerate \
Pillow \
gradio \
streamlit \
flask \
uvicorn \
fastapi

可用于运行：

** Stable Diffusion

BLIP / CLIP
Qwen-VL（多模态大模型）

🛠️ 3.6、性能监控与调试工具

pip3.10 install \
memory_profiler \
line_profiler \
objgraph \
torchinfo

📦 3.7、虚拟环境管理（推荐使用）

避免依赖冲突，建议为每个项目创建独立环境：

# 创建虚拟环境
python3.10 -m venv ai_env

# 激活环境
source ai_env/bin/activate

# 安装包
pip install torch transformers...

# 退出环境
deactivate

🧩 3.8、可选：安装 Conda（更强大的包管理）

如果你希望更方便地管理不同 Python 版本和依赖，可以安装 Miniconda：

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh

然后使用 conda 安装 AI 包，支持二进制预编译，减少编译错误。

✅ 3.9 总结：你可以一键运行的安装脚本（建议分步执行）

# 1. 系统依赖
sudo apt update && sudo apt install -y build-essential cmake pkg-config libffi-dev libssl-dev libbz2-dev libreadline-dev libsqlite3-dev libncurses5-dev libnss3-dev libgdbm-dev libdb5.3-dev liblzma-dev zlib1g-dev libcurl4-openssl-dev libopenblas-dev libatlas-base-dev libjpeg-dev libpng-dev libfreetype6-dev libxft-dev git wget python3-pip python3-dev

# 2. Python 基础库
pip3.10 install --upgrade pip
pip3.10 install numpy scipy pandas matplotlib scikit-learn opencv-python-headless pillow requests tqdm psutil GPUtil

# 3. 深度学习框架（PyTorch CPU）
pip3.10 install torch torchvision torchaudio

# 4. 大模型工具
pip3.10 install transformers accelerate peft bitsandbytes llama-cpp-python langchain dashscope

📚 3.10 后续建议

使用阿里云通义千问 API（免费额度 + 高性能）：

pip install dashscope

文档：https://help.aliyun.com/zh/dashscope/ 本地运行 Qwen 模型：

下载 GGUF 模型（如 qwen1.5-1.8b-gguf）
使用 llama.cpp 或 vLLM 加载部署 Web 服务：用 Gradio 或 FastAPI 快速搭建界面。

注意：本文归作者所有，未经作者允许，不得转载