产品手册数字人

数字人

解决企业内容生产瓶颈的 AI 数字人解决方案，覆盖短视频生成与直播互动。

产品简介

数字人梦工厂 (Digital Human Dream Factory) 致力于解决企业在短视频制作与直播带货中的“拍摄难、出镜难、成本高”等痛点。通过 AI 技术生成的超写实数字人，不仅形象逼真、口型准确，更能实现 7x24 小时不间断的直播互动。

核心价值

产能革命: 无需真人出镜、无需搭建影棚、无需复杂后期，仅需一段文本或语音，即可生成高质量的口播视频。

核心能力

1. 视频内容生成

文生视频 (Text-to-Video): 输入营销文案，选择预置的模特形象与声音，分钟级生成口播短视频。
多语言适配: 支持中、英、日、韩等 20+ 种语言的唇形驱动，助力品牌出海。

2. 7x24h 直播带货

自动直播: 数字主播不知疲倦，全天候在抖音、TikTok 等平台进行商品讲解与带货。
实时互动: 连接 LLM 大脑，能够实时识别直播间弹幕，并进行生动的语音回复与情绪表达。

3. 形象定制 (Avatar Clone)

真人复刻: 仅需 5 分钟真人出镜视频素材，即可训练出 1:1 的数字分身。
声音克隆: 高保真还原真人的音色、语调与说话习惯。

应用场景

品牌自播

品牌不再受限于主播排班，使用数字人填补深夜流量空窗期，实现全时段覆盖。

知识付费 / 培训

讲师录制一次课程后，可使用数字分身快速生成后续的更新内容，极大降低课程制作成本。

本地生活推广

批量生成数百条针对不同门店、不同套餐的探店视频，通过矩阵账号分发获取同城流量。

产品使用指南

1. 形象克隆 (Clone)

拍摄素材: 请真人在纯色背景下，正对镜头朗读一段 5 分钟的文案。保持头部不动，口型夸张清晰。
训练与部署: 上传素材至“形象工场”。系统会自动训练声音和面部模型（约需 2 小时）。训练完成后，该形象即可在“主播库”中选用。

2. 视频制作 (Studio)

数字人视频制作工坊

新建项目: 选择横屏 (16:9) 或竖屏 (9:16) 画布。
驱动模式:
- 文本驱动: 输入文案，调整语速、停顿。
- 音频驱动: 上传录好的真人音频，数字人仅匹配口型（适合对情绪要求极高的场景）。
背景装修: 添加背景图、前景贴纸（如：限时折扣）、背景音乐。

3. 直播间搭建

选品配置: 在直播控制台添加商品卡片，关联讲解话术。
互动规则: 配置“关键词回复”。当弹幕出现“多少钱”时，数字人优先回复价格话术；当没人提问时，轮播商品讲解。

最佳实践

黄金前3秒: 短视频开头务必使用疑问句或强反差画面，留住用户。数字人的表情（如：惊讶、点头）需与文案情绪点对齐。
音频质量: 声音是数字人的灵魂。建议使用专业麦克风录制训练素材，避免环境噪音。
人机混播: 在直播黄金时段（如 20:00-22:00）使用真人主播，其他时段切换为数字人，最大化 ROI。

常见问题 (FAQ)

Q: 数字人说话口型对不上怎么办？
- A: 请确保 TTS 音频清晰无杂音。在“驱动设置”中，调节 Lip Sync Latency（一般设为 -50ms 至 +50ms 微调）。
Q: 直播需要什么样的电脑配置？
- A: 推荐使用 NVIDIA RTX 3060 以上显卡，16GB 内存。如果是推流 4K 画质，建议 RTX 4070 及以上。
Q: 可以导出绿幕视频吗？
- A: 可以。生成视频时选择 Transparent Background (MOV/ProRes) 格式，方便导入 Pr/Ae 进行后期合成。

Previous

CRM

Next

数字员工

On this page

产品简介核心能力 1. 视频内容生成 2. 7x24h 直播带货 3. 形象定制 (Avatar Clone)应用场景品牌自播知识付费 / 培训本地生活推广产品使用指南 1. 形象克隆 (Clone)2. 视频制作 (Studio)3. 直播间搭建最佳实践常见问题 (FAQ)