
端侧实现多语种识别、实时翻译与自然语音合成。可在桌面设备、会议终端、导览机等形态上落地双向对话与跨语种交流。
核心优势




在仓储、车间、机房等现场,端侧语音可替代复杂界面与扫码工具,让一线工人通过自然语言完成出入库登记、设备点检、巡检表单填报、危险事件播报。本地 ASR 输出结构化文字,可对接 WMS / MES / IoT 平台。
核心优势




XIAO ESP32S3 做低功耗唤醒前端,触发 AI 盒子启动 ASR-TTS 流水线;声纹识别区分不同成员的偏好;对接 Matter / HomeAssistant / 米家等本地协议执行控制。指令本地处理,断网不影响日常使用。
核心优势




语音方案的算力放在哪,决定整机能力上限与单台 BOM。常见落地拆成 3 类:
核心优势
| 产品 | 档次 | 准确度 | 支持的语音能力 | 并发 | 试听音色 | 参考价 |
|---|---|---|---|---|---|---|
XIAO ESP32-S3 Sense | 唤醒前端(板载麦克风) | — | 唤醒词 / 命令词 | — | — | ~$10 |
reRouter CM4 | 入门级 | 基础 | 单语种本地转录 | — | 机器音 | $200–300 |
reComputer AI R2130-12 | 入门级 | 中等 | 单语言对话 | 单路 | 模拟音 | ~$339 |
reComputer RK3576 | 单机版 | 好 | 多语言对话 + 本地 LLM* | 单路 | 模拟音 | ~$139 |
reComputer RK3588 | 单机版 | 好 | 多语言对话 + 本地 LLM* | 单路 | 模拟音 | ~$199 |
reComputer J3011 | 专业级 | 好 | 多语言对话 | 2 路 | 模拟音 / 真人音 | ~$599 |
reComputer J4012 | 专业级 | 好 | 多语言对话 + 本地 LLM | 2–3 路 | 模拟音 / 真人音 | $800–900 |
reComputer J5012 | 旗舰级 | 优 | 多语言对话 + 高级 LLM | 高并发 | 真人音 | ~$2,000 |
AI 算力盒按"能跑哪些语音能力"分档。下表列出档次、准确度、能跑什么、并发与试听音色档及价位(麦克风与扬声器选型见下个 Tab)。*RK 系列本地 LLM 需搭配 1282 AI 加速扩展卡(附件)。
核心优势
| 产品 | 类型 | 芯片 | 拾音 距离 | 识音 角度 | 内置 功放 | 核心算法 |
|---|---|---|---|---|---|---|
reSpeaker Lite | 线形 双麦 | XMOS XU316 | 3m | 180° | 5W | AEC · DoA |
reSpeaker XVF3800 | 圆形 四麦 | XMOS XVF3800 | 5m | 360° | 5W | AEC · DoA · Multi-beamforming |
reSpeaker Flex Circular-4 | 圆形 四麦 | XMOS XVF3800 | 5m | 360° | 10W | AEC · DoA · Multi-beamforming |
reSpeaker Flex Linear-4 | 线形 四麦 | XMOS XVF3800 | 5m | 180° | 10W | AEC · DoA · Multi-beamforming |
核心优势