Deepseek安装指南

手把手教你完成Deepseek系列大模型的本地部署与使用

什么是Deepseek？

Deepseek是由深度求索（DeepSeek）开发的一系列大语言模型，包含Deepseek-V1、Deepseek-V2以及Deepseek-R1等版本。这些模型在代码生成、自然语言理解、数学推理等方面表现出色，支持本地部署和API调用。

本指南将帮助你从零开始完成Deepseek模型的安装与配置。

安装准备

系统要求

操作系统：Linux (Ubuntu 20.04+)、macOS 或 Windows (WSL推荐)
内存：至少16GB RAM（推荐32GB+）
显卡：NVIDIA GPU（推荐12GB显存以上，如RTX 3090/4090）
磁盘空间：50GB以上可用空间（模型文件较大）

软件依赖

Python 3.9 或以上版本
PyTorch 2.0+
Git
transformers、accelerate、bitsandbytes 等Python库

安装步骤

1. 克隆官方仓库

git clone https://github.com/deepseek-ai/DeepSeek.git
cd DeepSeek

2. 创建虚拟环境并安装依赖

python -m venv deepseek-env
source deepseek-env/bin/activate  # Linux/macOS
# 或 deepseek-env\Scripts\activate (Windows)

pip install -r requirements.txt

3. 下载模型文件

通过Hugging Face或官方渠道获取模型权重：

from transformers import AutoTokenizer, AutoModelForCausalLM

model_name = "deepseek-ai/deepseek-llm-7b-chat"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")

提示：首次运行会自动下载模型，文件较大，请确保网络稳定。

启动与测试

创建一个测试脚本 test.py：

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

# 加载模型
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/deepseek-llm-7b-chat")
model = AutoModelForCausalLM.from_pretrained(
    "deepseek-ai/deepseek-llm-7b-chat",
    device_map="auto",
    torch_dtype=torch.float16
)

# 生成测试
input_text = "你好，请介绍一下你自己。"
inputs = tokenizer(input_text, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=128)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

运行测试：

python test.py

常见问题

Q: 模型加载报错“CUDA out of memory”怎么办？

A: 尝试使用量化版本（如4-bit或8-bit加载），或更换更小的模型（如6.7B版本）。

Q: 如何使用Deepseek API？

A: Deepseek提供官方API服务，注册后获取API Key，通过HTTP请求调用：

curl https://api.deepseek.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-chat",
    "messages": [{"role": "user", "content": "你好"}]
  }'