AI Lab — Rockchip 边缘 AI 模型库 - 1

AI Lab — Rockchip 边缘 AI 模型库

在 reComputer RK3576/RK3588 上一站式试用主流 AI 模型——目标检测、对话、图片理解,全部本地运行。

入门15min人工智能
rk3576rk3588edge-ainpuyoloobject-detection大模型deepseekvlmqwenmultimodal

这个 Lab 能帮你做什么

在 reComputer RK3576 / RK3588 上一站式试用主流开源 AI 模型。选一个预设、一键部署,就能开始调用 API ——全部在本地设备运行,不用上云。

预设模型你将获得适配硬件
目标检测YOLO 11(极速版 / 均衡版 / 精确版)在图片或实时视频中识别 80 种常见物体RK3576 或 RK3588
大模型对话DeepSeek-R1(1.5B / 7B,多种量化)OpenAI 兼容的本地对话 APIRK3576(7B 建议 8GB 内存)
视觉对话Qwen2.5-VL看图说话、对图片提问RK3576(8GB+)

输出接口

预设端点方法说明
目标检测:8000/api/models/yolo11/predictPOST上传图片,返回检测框
目标检测:8000/api/video_feedGET带检测框叠加的 MJPEG 视频流
大模型对话:8001/v1/chat/completionsPOSTOpenAI 兼容对话接口(支持流式)
视觉对话:8002/v1/chat/completionsPOSTOpenAI 兼容视觉接口(文本 + 图片)
视觉对话:8002/docsGET交互式 API 文档(Swagger UI)

快速开始 —— 目标检测:

curl -X POST http://<device-ip>:8000/api/models/yolo11/predict \
  -F "file=@photo.jpg" -F "conf=0.5"

快速开始 —— 对话(LLM 或 VLM):

curl http://<device-ip>:8001/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{"model":"rkllm-model","messages":[{"role":"user","content":"你好!"}],"max_tokens":256}'

核心价值

  • 一套平台,三种模型 —— 不用搭三套环境,就能试检测、对话、看图三类能力
  • 默认全本地 —— 图片和对话都不离开设备
  • 标准 API —— REST + OpenAI 兼容接口,现有客户端可直接接入
  • NPU 加速 —— 瑞芯微 NPU 在低功耗硬件上高效完成推理

集成场景

场景选用预设怎么配合
安防摄像头入侵检测目标检测NVR 调用推理 API,识别人员/车辆并告警
离线网络中的对话助手大模型对话OpenAI 客户端直接指向本地接口
文档筛查 / 图片初判视觉对话上传截图,用自然语言提问
机器人感知 + 对话目标检测 + 大模型对话检测结果交给 LLM 推理,同一台设备完成

技术规格

规格数值
目标检测延迟~30ms/帧(RK3576) · ~20ms(RK3588)
大模型速度取决于变体——1.5B 最快,7B 推理最强
内存要求1.5B LLM 需 4GB · 7B LLM 与视觉对话需 8GB+
磁盘要求每个预设 3–10GB,取决于所选模型
支持硬件reComputer RK3576(全部预设) · reComputer RK3588 / ROCK 5T(仅目标检测)

使用须知

  • 三个预设相互独立——可以同时部署在同一台 RK3576 上(分别用 8000 / 8001 / 8002 端口)
  • 首次启动会下载 Docker 镜像(1–4GB)并加载模型,请预留几分钟
  • 目标检测无摄像头也可用(图片上传始终可用)
  • 大模型对话和视觉对话仅支持 RK3576——RK3588 暂未提供 RKLLM NPU 支持
  • 所有对话和检测都留在本地,不会发送到任何云端

集成接口

http

Object Detection preset — image upload prediction

/api/models/yolo11/predict · Port: 8000 · Method: POST
{"predictions":[{"class":"person","confidence":0.92,"box":{"x1":100,"y1":200,"x2":300,"y2":500}}]}
http_stream

Object Detection preset — MJPEG video stream with detection boxes overlay

/api/video_feed · Port: 8000 · Method: GET
http

LLM Chat preset — OpenAI-compatible chat completion API

/v1/chat/completions · Port: 8001 · Method: POST
{"model":"rkllm-model","messages":[{"role":"user","content":"Hello"}],"max_tokens":512,"stream":false}
http

Vision Chat preset — OpenAI-compatible vision API (text + image input)

/v1/chat/completions · Port: 8002 · Method: POST
{"model":"rkllm-vision","messages":[{"role":"user","content":[{"type":"text","text":"Describe this image"},{"type":"image_url","image_url":{"url":"https://example.com/photo.jpg"}}]}]}

使用说明

network

Network connection for Docker image pull

rtsp

USB camera (optional, only needed for Object Detection live video)

部署方案

edge_device
reComputer RK3588
reComputer RK3588
联系我们
获取方案参考设计与产品选型支持。
下一步