
端侧实现多语种识别、实时翻译与自然语音合成。可在桌面设备、会议终端、导览机等形态上落地双向对话与跨语种交流。
核心优势




在仓储、车间、机房等现场,端侧语音可替代复杂界面与扫码工具,让一线工人通过自然语言完成出入库登记、设备点检、巡检表单填报、危险事件播报。本地 ASR 输出结构化文字,可对接 WMS / MES / IoT 平台。
核心优势




XIAO ESP32S3 做低功耗唤醒前端,触发 AI 盒子启动 ASR-TTS 流水线;声纹识别区分不同成员的偏好;对接 Matter / HomeAssistant / 米家等本地协议执行控制。指令本地处理,断网不影响日常使用。
核心优势




语音方案的算力放在哪,决定整机能力上限与单台 BOM。常见落地拆成 3 类:
核心优势
| 产品 | 档次 | 支持的语音能力 | 试听音色 | 参考价 |
|---|---|---|---|---|
XIAO ESP32-S3 Sense | 唤醒前端(板载麦克风) | 唤醒词 / 命令词 | — | ~$10 |
reRouter CM4 | 入门级 | 单语种本地转录 | — | $200–300 |
reComputer AI R2130-12 | 入门级 | 多语言双向对话 | 机器音 | ~$339 |
reComputer J4012 | 专业级 | 多语言对话 + 声音克隆 | 模拟音 | $800–900 |
reComputer J5012 | 旗舰级 | 多语言对话 + 克隆 + 本地 LLM | 真人音 | ~$2,000 |
AI 算力盒按"能跑哪些语音能力"分档。下表只列档次、能跑什么、试听音色档与价位(麦克风与扬声器选型见下个 Tab)。
核心优势
| 产品 | 类型 | 适用范围 | 关键参数 |
|---|---|---|---|
ReSpeaker Lite | 拾音 (近场) | ≤ 3m / 桌面 / 单人工位 | 2-Mic 阵列 / 板载 AI 音频处理 / USB · I²S |
ReSpeaker XVF3800 | 拾音 (中远场) | 3–5m / 会议 / 客厅 / 工位 | 4-Mic / XMOS DSP / AEC / 含 ESP32S3 唤醒前端 |
ReSpeaker Flex Circular-4 | 拾音+出声 (圆形) | 机器人 360° / 含唤醒前端 | 4-Mic / XMOS DSP / AEC / 含 ESP32S3 / 10W 功放 |
ReSpeaker Flex Linear-4 | 拾音+出声 (线形) | 机器人 180° / 含唤醒前端 | 4-Mic / XMOS DSP / AEC / 含 ESP32S3 / 10W 功放 |
麦克风的核心选型变量是"拾音距离"与"环境噪声"。拾音 + 出声搭配的关键参数与推荐组合如下。
核心优势