AI Lab — Rockchip 边缘 AI 模型库

这个 Lab 能帮你做什么

在 reComputer RK3576 / RK3588 上一站式试用主流开源 AI 模型。选一个预设、一键部署，就能开始调用 API ——全部在本地设备运行，不用上云。

预设	模型	你将获得	适配硬件
目标检测	YOLO 11（极速版 / 均衡版 / 精确版）	在图片或实时视频中识别 80 种常见物体	RK3576 或 RK3588
大模型对话	DeepSeek-R1（1.5B / 7B，多种量化）	OpenAI 兼容的本地对话 API	RK3576（7B 建议 8GB 内存）
视觉对话	Qwen2.5-VL	看图说话、对图片提问	RK3576（8GB+）

输出接口

预设	端点	方法	说明
目标检测	:8000/api/models/yolo11/predict	POST	上传图片，返回检测框
目标检测	:8000/api/video_feed	GET	带检测框叠加的 MJPEG 视频流
大模型对话	:8001/v1/chat/completions	POST	OpenAI 兼容对话接口（支持流式）
视觉对话	:8002/v1/chat/completions	POST	OpenAI 兼容视觉接口（文本 + 图片）
视觉对话	:8002/docs	GET	交互式 API 文档（Swagger UI）

快速开始 —— 目标检测：

curl -X POST http://<device-ip>:8000/api/models/yolo11/predict \
  -F "file=@photo.jpg" -F "conf=0.5"

快速开始 —— 对话（LLM 或 VLM）：

curl http://<device-ip>:8001/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{"model":"rkllm-model","messages":[{"role":"user","content":"你好！"}],"max_tokens":256}'

核心价值

一套平台，三种模型 —— 不用搭三套环境，就能试检测、对话、看图三类能力
默认全本地 —— 图片和对话都不离开设备
标准 API —— REST + OpenAI 兼容接口，现有客户端可直接接入
NPU 加速 —— 瑞芯微 NPU 在低功耗硬件上高效完成推理

集成场景

场景	选用预设	怎么配合
安防摄像头入侵检测	目标检测	NVR 调用推理 API，识别人员/车辆并告警
离线网络中的对话助手	大模型对话	OpenAI 客户端直接指向本地接口
文档筛查 / 图片初判	视觉对话	上传截图，用自然语言提问
机器人感知 + 对话	目标检测 + 大模型对话	检测结果交给 LLM 推理，同一台设备完成

技术规格

规格	数值
目标检测延迟	~30ms/帧（RK3576） · ~20ms（RK3588）
大模型速度	取决于变体——1.5B 最快，7B 推理最强
内存要求	1.5B LLM 需 4GB · 7B LLM 与视觉对话需 8GB+
磁盘要求	每个预设 3–10GB，取决于所选模型
支持硬件	reComputer RK3576（全部预设） · reComputer RK3588 / ROCK 5T（仅目标检测）

使用须知

三个预设相互独立——可以同时部署在同一台 RK3576 上（分别用 8000 / 8001 / 8002 端口）
首次启动会下载 Docker 镜像（1–4GB）并加载模型，请预留几分钟
目标检测无摄像头也可用（图片上传始终可用）
大模型对话和视觉对话仅支持 RK3576——RK3588 暂未提供 RKLLM NPU 支持
所有对话和检测都留在本地，不会发送到任何云端

AI Lab — Rockchip 边缘 AI 模型库

这个 Lab 能帮你做什么

输出接口

核心价值

集成场景

技术规格

使用须知

集成接口

使用说明

部署方案

Object Detection (YOLO 11)

LLM Chat (DeepSeek-R1)

Vision Chat (Qwen2.5-VL)