Skip to main content
30
:
00
:
00
立减 40%
查看套餐
LPM 1.0 技术报告 — 43页 · 15图

LPM 1.0:视频角色表演生成模型 — 实时AI视频生成

当前虚拟形象系统的问题:循环动画、僵硬表情、无法真正聆听和反应。LPM 1.0(Large Performance Model)改变了这一切。一张图像即可生成实时角色视频——说话、聆听、演唱、表达情感——延迟仅为竞品的三分之一,身份永不漂移。LPM 1.0 AI是对话代理、虚拟主播和游戏NPC的视觉引擎。

LPM 1.0 AI 实时生成角色视频——说话、聆听、演唱、情感表达

Creator avatar 1Creator avatar 2Creator avatar 3Creator avatar 4Creator avatar 5Creator avatar 6

逐火科技20+位研究人员打造 — Hugging Face 热门论文

LPM 1.0 Gallery

LPM 1.0 AI视频画廊 — 角色表演演示

以下每个视频均展示 LPM 1.0 AI角色表演能力。从全双工对话到情感演唱和反应式聆听——了解 LPM 1.0 大型表演模型如何实时生成身份一致、无限时长的输出。

Curated12

LPM 1.0 全双工对话

LPM 1.0 情感表演

LPM 1.0 演唱表演

LPM 1.0 反应式聆听

LPM 1.0 身份保持

LPM 1.0 零样本泛化

LPM 1.0 多模态控制

LPM 1.0 长时间生成

LPM 1.0 情绪转变

LPM 1.0 多样角色

LPM 1.0 交互场景

LPM 1.0 动作控制

Publish Everywhere

LPM 1.0 AI视频生成的应用场景

Platforms5
对话AIReady to publish
游戏NPCReady to publish
虚拟主播Ready to publish
教育Ready to publish
无障碍Ready to publish
关于 LPM 1.0

什么是 LPM 1.0 — 面向实时AI视频的大型表演模型

LPM 1.0 模型是面向视频角色表演的 Large Performance Model,专为实时生成能说话、聆听、反应、并在长时间交互中保持身份一致的角色视频而设计。人类对话不只是语言——更是节奏、注视、停顿,和无数让交互鲜活的微表情。此前没有任何AI视频系统能实时捕捉这完整的光谱。你必须在三者中选二:快但僵硬、表现力强但慢、或一致但呆板。LPM 1.0(Large Performance Model)是首个同时做到三者的17B参数扩散Transformer——实时速度、表演品质、长时间交互中的身份一致性。在作品集查看 LPM 1.0 示例,或阅读技术指南了解更深入的架构剖析。

01

LPM 1.0 AI视频中的身份保持

LPM 1.0 采用多粒度身份条件化:全局外观参考、多视角身体图像和面部表情范例。LPM 1.0 AI模型实现专业级身份保持,在10+分钟连续生成中保持一致。

02

LPM 1.0 视频生成中的多模态控制

用文本告诉角色做什么。用音频塑造情感。用图像定义角色。LPM 1.0 统一三种控制信号在单次生成中,实现 LPM 1.0 AI实时视频生成中的精细控制。

03

LPM 1.0 零样本角色泛化

LPM 1.0 接受任意风格角色——写实、动漫、3D、非人形——无需微调即可生成AI视频表演。LPM 1.0 AI在单一模型中跨所有视觉风格泛化。

04

LPM 1.0 AI全双工对话

LPM 1.0 是首个实现全双工对话视频生成的模型。角色说话时具有精准唇形同步,同时生成反应式聆听行为。LPM 1.0 AI在实时中创造真正的交互式对话。

在线使用 LPM — 无需安装

在浏览器里直接预览角色表演视频——无需 GPU、无需 Python、无需搭建动画流程。先看作品和价格,再决定是否生成自己的视频。对比 LPM 1.0 套餐,年付低至 ¥71.6/月

核心能力

LPM 1.0 AI视频生成核心能力

LPM 1.0 基于协同设计的数据管线、模型架构和流式推理优化构建,提供现有任何AI视频系统都不具备的能力。

LPM 1.0 AI通过多粒度身份条件化实现专业级角色保真。全局外观参考、多视角身体图像和面部表情范例为 LPM 1.0 模型提供完整身份信息,实现身份一致的AI视频生成。

01Active Preview

核心能力

角色保真 — LPM 1.0 多参考身份系统

LPM 1.0 AI通过多粒度身份条件化实现专业级角色保真。全局外观参考、多视角身体图像和面部表情范例为 LPM 1.0 模型提供完整身份信息,实现身份一致的AI视频生成。

LPM 1.0 如何生成实时AI视频 — 技术管线

LPM 1.0 基于协同设计的数据管线、模型架构和流式推理优化构建,实现实时AI视频角色表演生成。

1

LPM 1.0 多模态数据集构建

LPM 1.0 AI视频生成从多模态以人为中心数据集开始,通过严格过滤、音视频配对、表演理解和身份感知多参考提取构建。

2

Base LPM 训练 — 17B扩散Transformer

Base LPM 是17B参数扩散Transformer,通过多模态条件化训练。LPM 1.0 AI同时处理角色图像、音频和文本生成高质量角色视频。

3

DMD蒸馏实现Online LPM

Base LPM通过DMD蒸馏为Online LPM因果流式生成器,将 LPM 1.0 扩散压缩到2步,0.35秒延迟实现实时AI视频生成。

4

LPM 1.0 在线流式推理

推理时 LPM 1.0 AI在聆听、说话、静默三种状态下生成角色视频。Online LPM以480P/720P 24fps实时输出。

LPM 1.0 AI视频生成 — 核心技术特性

使 LPM 1.0 成为最先进AI视频角色表演模型的核心技术创新。

LPM 1.0 全双工AI视频

LPM 1.0 是唯一支持真正全双工对话视频生成的模型。角色在实时 LPM 1.0 AI视频中同时说话和聆听。

LPM 1.0 生成0.35秒延迟

LPM 1.0 通过DMD蒸馏实现0.35秒延迟。Online LPM将扩散压缩到2步实现实时输出。

LPM 1.0 AI视频身份一致性

LPM 1.0 在10+分钟内保持身份一致的角色视频生成,无漂移。多粒度条件化使 LPM 1.0 模型无限期保持角色外观。

480P/720P 24fps — LPM 1.0 输出

LPM 1.0 以480P和720P 24fps生成AI视频,支持实时交互和高保真录制。

LPM 1.0 多模态条件化

LPM 1.0 AI在单次生成中统一文本、音频和图像控制。

LPM 1.0 AI零样本泛化

LPM 1.0 为任意角色风格生成表演视频,无需微调。LPM 1.0 AI在单一架构中跨所有视觉领域泛化。

LPM Bench

LPM 1.0 对比 LiveAvatar 与 OmniHuman — AI视频表演模型评测

LPM-Bench基准测试表明 LPM 1.0 在所有评估维度上达到业界最优。

01

LPM 1.0 对比 LiveAvatar

LPM 1.0 实现0.35秒延迟(LiveAvatar >1秒),支持全双工、无限时长和零样本泛化。LPM 1.0 在LPM-Bench每个维度都超越LiveAvatar。

02

LPM 1.0 对比 OmniHuman

OmniHuman离线运行且长度固定。LPM 1.0 AI以0.35秒延迟实时生成,支持无限时长、全双工、演唱和零样本泛化。

03

LPM 1.0 对比 Kling-Avatar-2

Kling-Avatar-2延迟约0.8秒,无全双工,最大5分钟。LPM 1.0 AI提供0.35秒延迟、全双工和无限时长。17B参数+DMD蒸馏的架构优势。

应用场景

谁能从 LPM 1.0 AI视频生成中受益

LPM 1.0 作为需要实时、身份一致角色表演应用的视觉引擎。

01

LPM 1.0 驱动的对话AI代理

LPM 1.0 AI视频生成将文本聊天机器人转化为视觉对话代理,与ChatGPT、豆包等A2A模型即插即用兼容。

02

LPM 1.0 游戏NPC角色表演

游戏开发者使用 LPM 1.0 创建具有实时表演的NPC。LPM 1.0 AI用真正的角色表演替代预设动画。

03

LPM 1.0 虚拟主播

LPM 1.0 AI使虚拟主播能以全双工对话、演唱和情感实时表演,为任意角色风格生成身份一致视频。

04

LPM 1.0 AI无障碍与教育

LPM 1.0 AI视频生成促进教育公平和无障碍服务,生成能实时自然回应用户互动的虚拟导师和陪伴角色。

Performance Snapshot

LPM 1.0 AI视频生成 — 核心数据

全球最大实时AI视频角色表演模型,所有维度对比竞品均达到业界最优

17B 最大角色表演模型

01
17B

最大角色表演模型

0.35秒 竞品3倍速度

02
0.35秒

竞品3倍速度

45分钟+ 零身份漂移

03
45分钟+

零身份漂移

Creator Proof

研究者和开发者对 LPM 1.0 的评价

来自AI视频生成领域的真实反馈。

Verified Review

我们在管线中测试了 LPM 1.0 与所有现有虚拟形象系统的对比。全双工能力前所未有——角色在说话的同时真正在聆听。没有其他模型能接近这种实时交互表演水平。

Dr. Wei Chen, 资深CV研究员,Top-5 AI实验室

Dr. Wei Chen

资深CV研究员,Top-5 AI实验室

Verified Review

我们将 LPM 1.0 接入了UE5管线。动漫NPC和3D角色无需微调直接可用——零样本。0.35秒延迟让实时过场动画生成首次成为可能。

Takeshi Yamamoto, 技术总监,3A游戏工作室

Takeshi Yamamoto

技术总监,3A游戏工作室

Verified Review

一个下午就把 LPM 1.0 接入了基于ChatGPT的对话代理。文字聊天机器人现在有了一张会反应的脸——点头、思考、微笑。用户说感觉像在和真人对话。30分钟会话身份完美保持。

Sarah Rodriguez, ML工程师,对话AI创业公司

Sarah Rodriguez

ML工程师,对话AI创业公司

Verified Review

我们用中文抒情歌和英文摇滚歌测试 LPM 1.0——都完美通过。口型跟随旋律,呼吸感真实,长音保持稳定。训练数据里没有任何演唱数据。太不可思议了。

Marcus Liu, 创意总监,数字媒体工作室

Marcus Liu

创意总监,数字媒体工作室

Verified Review

对于有沟通障碍的用户来说,拥有一个真正在聆听——而不只是等待输入——的虚拟伙伴,意义完全不同。LPM 1.0 生成了我们多年来一直试图构建的那种有共情力的响应式存在。

Dr. Emma Larsson, HCI研究员,无障碍实验室

Dr. Emma Larsson

HCI研究员,无障碍实验室

Verified Review

我们跑了45分钟连续会话——角色身份一次都没有漂移。仅这一个事实就让我们管线中的所有预录动画循环变得过时。LPM 1.0 不是渐进式改进,而是品类级跃迁。

Alex Petrov, 动画导演,虚拟制作

Alex Petrov

动画导演,虚拟制作

FAQ

LPM 1.0 AI视频模型常见问题

关于 LPM 1.0(Large Performance Model)实时AI视频角色表演生成的常见问题。

0.35秒实时角色表演背后的架构

一个模型如何同时实现全双工对话、无限时长身份一致和零样本泛化——且延迟仅0.35秒?LPM 1.0 技术报告用43页完整揭示了整条管线。这种架构透明度在该领域极为罕见。