
L’essor de l’intelligence artificielle open-source a donné naissance à une multitude de modèles performants et accessibles à tous. Parmi eux, DeepSeek R1 fait figure de référence récente pour ceux qui cherchent un modèle de langage puissant, efficace et capable de tourner localement sur des machines modernes. Dans ce guide, vous apprendrez étape par étape à exécuter DeepSeek R1 en local, que vous soyez un développeur chevronné ou un passionné d’IA.
Partie 1 : Comprendre DeepSeek R1
1.1 Qu’est-ce que DeepSeek R1 ?
DeepSeek R1 est un modèle de langage open-source développé par l’équipe DeepSeek, qui vise à rivaliser avec les géants comme LLaMA 2, Mistral ou GPT-J. Il s’appuie sur une architecture de type Transformer, avec des optimisations pour l’exécution locale.
Les principales caractéristiques :
- Open-source sous licence Apache 2.0
- Disponible en plusieurs tailles (7B, 13B…)
- Pré-entraîné sur un large corpus multilingue
- Compatible avec les librairies modernes (Transformers, vLLM, etc.)
1.2 Pourquoi exécuter DeepSeek R1 localement ?
Voici quelques raisons de choisir une exécution locale :
- Indépendance des services cloud (OpenAI, Google, etc.)
- Protection des données sensibles : tout reste sur votre machine
- Personnalisation avancée (finetuning, injection de données spécifiques)
- Expérimentation sans limite de requêtes ni coût variable
Partie 2 : Prérequis techniques et matériel
2.1 Configuration matérielle recommandée
DeepSeek R1 est un gros modèle, et bien que des optimisations existent, il nécessite un matériel solide :
- Carte graphique : au minimum une NVIDIA avec 12 Go de VRAM (RTX 3060+ recommandé pour la version 7B)
- Processeur : multicœur (Intel i7 / AMD Ryzen 7 ou plus)
- RAM : 32 Go de mémoire vive
- Disque : au moins 50 Go d’espace disponible (modèle + dépendances)
2.2 Environnement logiciel
- Système d’exploitation : Linux (Ubuntu), macOS (Apple Silicon M1/M2), ou Windows WSL2
- Python : version 3.10 ou supérieure
- CUDA : version compatible avec PyTorch si vous utilisez le GPU
- Outils requis :
- Git
- Docker (optionnel)
- Anaconda (recommandé pour la gestion des environnements virtuels)
Partie 3 : Télécharger et préparer DeepSeek R1
3.1 Cloner le dépôt officiel
DeepSeek R1 est disponible via Hugging Face. Commencez par cloner un dépôt de démonstration :
bashCopierModifiergit clone https://github.com/deepseek-ai/DeepSeek-Vision.git
cd DeepSeek-Vision
Remarque : Il existe également un dépôt pour la version textuelle uniquement sur Hugging Face :
https://huggingface.co/deepseek-ai
3.2 Créer un environnement virtuel
Créez un environnement Python propre pour éviter les conflits de dépendances :
bashCopierModifierconda create -n deepseek python=3.10
conda activate deepseek
Ou via venv :
bashCopierModifierpython3 -m venv deepseek-env
source deepseek-env/bin/activate
3.3 Installer les dépendances
Installez PyTorch avec CUDA :
bashCopierModifierpip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
Installez les librairies nécessaires :
bashCopierModifierpip install transformers accelerate bitsandbytes
pip install huggingface_hub
Partie 4 : Charger et exécuter le modèle
4.1 Charger DeepSeek R1 depuis Hugging Face
Utilisez la librairie transformers pour charger le modèle :
pythonCopierModifierfrom transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "deepseek-ai/deepseek-llm-7b-base"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto", load_in_8bit=True)
device_map="auto"permet de répartir le modèle automatiquement sur les GPU/CPU disponibles.load_in_8bit=Trueréduit la consommation mémoire (nécessitebitsandbytes).
4.2 Interagir avec le modèle
Créez une fonction de génération de texte simple :
pythonCopierModifierdef generate(prompt):
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=150)
return tokenizer.decode(outputs[0], skip_special_tokens=True)
print(generate("Explique-moi la relativité en termes simples."))
Partie 5 : Optimisations et exécution fluide
5.1 Utiliser text-generation-webui pour interface graphique
Pour ceux qui veulent éviter le code, le projet text-generation-webui de oobabooga permet de lancer DeepSeek R1 en local avec une interface :
bashCopierModifiergit clone https://github.com/oobabooga/text-generation-webui.git
cd text-generation-webui
python download-model.py deepseek-ai/deepseek-llm-7b-base
python server.py --model deepseek-ai/deepseek-llm-7b-base
5.2 Utiliser quantisation (4-bit, GPTQ)
Pour réduire la charge mémoire, vous pouvez utiliser une version quantifiée :
bashCopierModifierpip install auto-gptq
Puis charger un modèle quantifié :
pythonCopierModifiermodel = AutoModelForCausalLM.from_pretrained(
"deepseek-ai/deepseek-llm-7b-GPTQ",
device_map="auto",
trust_remote_code=True
)
Partie 6 : Dépannage des erreurs courantes
6.1 « CUDA out of memory »
- Diminuez le nombre de tokens (
max_new_tokens) - Utilisez
load_in_8bit=Trueouload_in_4bit=True - Optez pour le CPU (
device_map="cpu") si vous n’avez pas de GPU performant
6.2 Erreur transformers version mismatch
Vérifiez que votre version de transformers est à jour :
bashCopierModifierpip install --upgrade transformers
6.3 Dépendances manquantes (bitsandbytes, accelerate…)
Installez manuellement :
bashCopierModifierpip install bitsandbytes accelerate
Partie 7 : Cas d’usage et applications
7.1 Génération de texte avancée
DeepSeek R1 excelle dans :
- L’assistance à la rédaction
- Le résumé de texte
- La génération de contenu SEO
- Les assistants conversationnels
7.2 Finetuning local
Grâce à des frameworks comme PEFT ou LoRA, vous pouvez affiner le modèle sur vos propres données :
bashCopierModifierpip install peft datasets
Utilisez ensuite Trainer ou SFTTrainer pour entraîner un modèle sur un corpus personnalisé.
7.3 Intégration dans une application web
Vous pouvez facilement intégrer DeepSeek R1 à une API Flask ou FastAPI pour créer un chatbot ou un assistant IA en ligne.
Conclusion
L’exécution locale de DeepSeek R1 est aujourd’hui accessible aux passionnés comme aux professionnels, avec des outils matures et une documentation grandissante. Que ce soit pour des raisons de sécurité, d’indépendance, ou pour explorer l’IA de manière plus technique, ce modèle offre une excellente alternative aux solutions cloud.
En résumé :
- Installez un environnement propre
- Téléchargez et chargez le modèle via
transformers - Optez pour des optimisations 8-bit ou GPTQ si besoin
- Intégrez-le dans vos projets personnels ou pro