思渡AI Logo
产品手册数字人

数字人

解决企业内容生产瓶颈的 AI 数字人解决方案,覆盖短视频生成与直播互动。

产品简介

数字人梦工厂 (Digital Human Dream Factory) 致力于解决企业在短视频制作与直播带货中的“拍摄难、出镜难、成本高”等痛点。通过 AI 技术生成的超写实数字人,不仅形象逼真、口型准确,更能实现 7x24 小时不间断的直播互动。

核心价值

产能革命: 无需真人出镜、无需搭建影棚、无需复杂后期,仅需一段文本或语音,即可生成高质量的口播视频。

核心能力

1. 视频内容生成

  • 文生视频 (Text-to-Video): 输入营销文案,选择预置的模特形象与声音,分钟级生成口播短视频。
  • 多语言适配: 支持中、英、日、韩等 20+ 种语言的唇形驱动,助力品牌出海。

2. 7x24h 直播带货

  • 自动直播: 数字主播不知疲倦,全天候在抖音、TikTok 等平台进行商品讲解与带货。
  • 实时互动: 连接 LLM 大脑,能够实时识别直播间弹幕,并进行生动的语音回复与情绪表达。

3. 形象定制 (Avatar Clone)

  • 真人复刻: 仅需 5 分钟真人出镜视频素材,即可训练出 1:1 的数字分身。
  • 声音克隆: 高保真还原真人的音色、语调与说话习惯。

应用场景

品牌自播

品牌不再受限于主播排班,使用数字人填补深夜流量空窗期,实现全时段覆盖。

知识付费 / 培训

讲师录制一次课程后,可使用数字分身快速生成后续的更新内容,极大降低课程制作成本。

本地生活推广

批量生成数百条针对不同门店、不同套餐的探店视频,通过矩阵账号分发获取同城流量。

产品使用指南

1. 形象克隆 (Clone)

  • 拍摄素材: 请真人在纯色背景下,正对镜头朗读一段 5 分钟的文案。保持头部不动,口型夸张清晰。
  • 训练与部署: 上传素材至“形象工场”。系统会自动训练声音和面部模型(约需 2 小时)。训练完成后,该形象即可在“主播库”中选用。

2. 视频制作 (Studio)

数字人视频制作工坊
  • 新建项目: 选择横屏 (16:9) 或竖屏 (9:16) 画布。
  • 驱动模式:
    • 文本驱动: 输入文案,调整语速、停顿。
    • 音频驱动: 上传录好的真人音频,数字人仅匹配口型(适合对情绪要求极高的场景)。
  • 背景装修: 添加背景图、前景贴纸(如:限时折扣)、背景音乐。

3. 直播间搭建

  • 选品配置: 在直播控制台添加商品卡片,关联讲解话术。
  • 互动规则: 配置“关键词回复”。当弹幕出现“多少钱”时,数字人优先回复价格话术;当没人提问时,轮播商品讲解。

最佳实践

  • 黄金前3秒: 短视频开头务必使用疑问句或强反差画面,留住用户。数字人的表情(如:惊讶、点头)需与文案情绪点对齐。
  • 音频质量: 声音是数字人的灵魂。建议使用专业麦克风录制训练素材,避免环境噪音。
  • 人机混播: 在直播黄金时段(如 20:00-22:00)使用真人主播,其他时段切换为数字人,最大化 ROI。

常见问题 (FAQ)

  • Q: 数字人说话口型对不上怎么办?
    • A: 请确保 TTS 音频清晰无杂音。在“驱动设置”中,调节 Lip Sync Latency(一般设为 -50ms 至 +50ms 微调)。
  • Q: 直播需要什么样的电脑配置?
    • A: 推荐使用 NVIDIA RTX 3060 以上显卡,16GB 内存。如果是推流 4K 画质,建议 RTX 4070 及以上。
  • Q: 可以导出绿幕视频吗?
    • A: 可以。生成视频时选择 Transparent Background (MOV/ProRes) 格式,方便导入 Pr/Ae 进行后期合成。