这个能力做什么
Z-Image-Turbo 将你的文字描述变成照片级真实的图片,完全运行在 Jetson Orin NX 上——不需要云服务、不需要订阅、不需要联网。发送一段文字提示,就能得到一张 PNG 图片。上传参考图并配上提示词,它就能智能地编辑图片。
所有计算都在你的设备上完成。模型封装为简洁的 HTTP API,方便你从任何应用中调用。
适用集成场景
| 场景 | 集成方式 |
|---|---|
| 创意工具和应用 | 从网页、桌面工具或自动化流程中调用 API,添加离线图片生成能力 |
| 隐私敏感场景 | 在医疗、法律或企业环境中运行,图片数据不出设备 |
| 互动装置 | 为自助拍照机、艺术装置等提供离线图片生成,不依赖云服务 |
| 模型研究 | 作为本地 60 亿参数扩散模型,进行延迟测量和流程集成实验 |
技术规格
| 指标 | 数值 |
|---|---|
| 模型 | Z-Image-Turbo(60 亿参数) |
| 硬件 | Jetson Orin NX 16GB,JetPack 6 |
| 运行时 | TensorRT BF16,无需 PyTorch |
| 384px 文生图 | 约 73 秒(4 步) |
| 512px 文生图 | 约 100 秒(4 步) |
| 最大缓存层数 | 18(512px)/ 23(384px) |
| API 并发 | 单请求串行处理(排队) |
| Docker 镜像大小 | 约 428 MB |
使用须知
- 硬件要求:Jetson Orin NX 16GB。Orin Nano 8GB 尚未验证。
- 前置条件:模型权重(约 20GB)和 TRT 引擎(每分辨率约 12GB)需提前从 Hugging Face 下载。
- 非实时生成:每张图片需要 1-2 分钟,取决于分辨率和步数。
- API 单工作进程:为控制在 GPU 内存限制内,一次只处理一个生成请求。

