Ollama 简介

安装与配置

第一个模型运行

基本命令介绍

模型库介绍

拉取与删除模型

模型版本管理

自定义模型

Modelfile 基础

模板语法

参数配置

系统提示词

本地服务部署

Docker 容器化

生产环境配置

监控与日志

Ollama 命令速查表

常见问题解答

学习资源推荐

模型库介绍

Ollama 支持众多开源大模型，介绍 Ollama 支持的各类模型，包括 Llama、Mistral、Qwen 等主流模型的特点和适用场景。本章将介绍主要的模型系列。

官方模型库

访问 Ollama 官方模型库：https://ollama.com/library

这里汇集了所有可用的模型，你可以：

浏览模型列表
查看模型详情
查看模型大小
阅读模型说明

Llama 系列

Llama 是 Meta（Facebook）开源的模型系列，是目前最流行的开源大模型之一。

Llama 3.2

版本	参数量	大小	特点
llama3.2:1b	1B	约 1.3 GB	极轻量，适合边缘设备
llama3.2:3b	3B	约 2.0 GB	平衡性能，日常使用推荐
llama3.2:11b	11B	约 6.5 GB	更强性能，需要更多资源

适用场景：

通用对话
文本生成
代码辅助
多语言任务

使用示例：

ollama run llama3.2:3b

Llama 3.1

版本	参数量	大小	特点
llama3.1:8b	8B	约 4.7 GB	性能优秀，推荐配置
llama3.1:70b	70B	约 40 GB	顶级性能，需要强大硬件

特点：

支持 128K 上下文
多语言能力强
推理能力出色

Mistral 系列

Mistral AI 开发的模型，以高效著称。

Mistral

版本	参数量	大小	特点
mistral:7b	7B	约 4.1 GB	高效，资源占用低
mixtral:8x7b	47B	约 26 GB	混合专家模型

适用场景：

资源受限环境
需要快速响应
通用任务

使用示例：

ollama run mistral:7b

Qwen 系列

通义千问是阿里巴巴开源的中文大模型，中文能力突出。

Qwen 2.5

版本	参数量	大小	特点
qwen2.5:0.5b	0.5B	约 0.5 GB	极轻量
qwen2.5:1.5b	1.5B	约 1.1 GB	轻量级
qwen2.5:3b	3B	约 2.0 GB	平衡选择
qwen2.5:7b	7B	约 4.7 GB	性能优秀
qwen2.5:14b	14B	约 9.0 GB	更强性能
qwen2.5:32b	32B	约 19 GB	顶级性能

特点：

中文理解能力强
支持长上下文
数学和逻辑推理好

适用场景：

中文对话
中文写作
中文代码注释
中文文档处理

使用示例：

ollama run qwen2.5:7b

Gemma 系列

Google 开源的轻量级模型。

Gemma 2

版本	参数量	大小	特点
gemma2:2b	2B	约 1.6 GB	极轻量
gemma2:9b	9B	约 5.5 GB	平衡性能
gemma2:27b	27B	约 16 GB	强大性能

特点：

轻量高效
多语言支持
安全性高

使用示例：

ollama run gemma2:9b

代码专用模型

CodeLlama

专门用于代码生成和理解的模型。

版本	参数量	大小
codellama:7b	7B	约 3.8 GB
codellama:13b	13B	约 7.0 GB
codellama:34b	34B	约 19 GB

适用场景：

代码生成
代码解释
代码补全
代码审查

使用示例：

ollama run codellama:7b

DeepSeek Coder

深度求索的代码模型，中文代码场景优秀。

版本	参数量	大小
deepseek-coder:6.7b	6.7B	约 4.0 GB

使用示例：

ollama run deepseek-coder:6.7b

多模态模型

Llava

支持图像理解的视觉语言模型。

版本	参数量	大小
llava:7b	7B	约 4.5 GB
llava:13b	13B	约 8.0 GB

适用场景：

图像描述
视觉问答
图像分类

使用示例：

ollama run llava:7b

其他模型

Yi 系列

零一万物开源的模型，中英文双语能力强。

版本	参数量	大小
yi:6b	6B	约 3.8 GB
yi:34b	34B	约 19 GB

Phi 系列

微软的轻量级模型。

版本	参数量	大小
phi3:3.8b	3.8B	约 2.3 GB
phi3:14b	14B	约 7.9 GB

模型选择指南

按硬件配置选择

内存	推荐模型
4GB	llama3.2:1b, qwen2.5:0.5b
8GB	llama3.2:3b, mistral:7b, qwen2.5:3b
16GB	llama3.1:8b, qwen2.5:7b, gemma2:9b
32GB+	llama3.1:70b, qwen2.5:32b, gemma2:27b

按使用场景选择

场景	推荐模型
日常对话	llama3.2:3b, mistral:7b
中文对话	qwen2.5:7b, yi:6b
代码生成	codellama:7b, deepseek-coder:6.7b
轻量部署	llama3.2:1b, phi3:3.8b
高性能需求	llama3.1:70b, qwen2.5:32b