LPM 1.0:動画ベースのキャラクターパフォーマンスモデル — リアルタイム AI 動画生成
従来のアバターシステムは機械的に感じられる — ループするアニメーション、固まった表情、本当に「聴く」「反応する」ことができない。LPM 1.0(Large Performance Model)はそれを変えます。1 枚の画像が、リアルタイムに話し・聴き・歌い・反応するキャラクターになる — 競合の 3 分の 1 の遅延、決して漂流しないアイデンティティで。LPM 1.0 AI は、対話エージェント、ライブ配信キャラクター、ゲーム NPC のためのビジュアルエンジンです。
LPM 1.0 AI はリアルタイムにキャラクター動画を生成 — 話す・聴く・歌う・感情表現
Anuttacon の 20 名以上の研究者が開発 — Hugging Face Papers でトレンド入り
LPM 1.0 AI 動画ギャラリー — キャラクターパフォーマンスデモ
下のすべての動画は LPM 1.0 AI のキャラクターパフォーマンス能力を示しています。全二重対話から感情豊かな歌唱、反応的なリスニングまで — LPM 1.0 Large Performance Model がリアルタイムで、アイデンティティを保ちながら、無限の長さで生成するものをご覧ください。
LPM 1.0 感情パフォーマンス
LPM 1.0 歌唱パフォーマンス
LPM 1.0 反応的リスニング
LPM 1.0 アイデンティティ保持
LPM 1.0 ゼロショット汎化
LPM 1.0 マルチモーダル制御
LPM 1.0 ロングフォーム生成
LPM 1.0 感情遷移
LPM 1.0 キャラクタースタイル
LPM 1.0 インタラクティブシーン
LPM 1.0 モーション制御
Publish Everywhere
あらゆる用途のための LPM 1.0 AI 動画生成
LPM 1.0 とは — リアルタイム AI 動画のための Large Performance Model
LPM 1.0 モデルは、動画ベースのキャラクターパフォーマンス(video-based character performance)のための Large Performance Model であり、話す・聴く・反応するキャラクター動画をリアルタイムに生成し、長時間の対話でもアイデンティティを保つよう設計されています。人間の会話は言葉だけでなく、リズム、視線、ためらい、無数の微表情によって生き生きとしたものになります。これまで、どの AI 動画システムもこの全領域をリアルタイムで捉えることはできませんでした。3 つのうち 2 つを選ぶしかなかった——速いが無表情、表現豊かだが遅い、または一貫性はあるが硬直的。LPM 1.0(Large Performance Model)は、リアルタイム速度・表現品質・長時間対話での一貫性のすべてを同時に実現する最初の 17B パラメータ Diffusion Transformer です。ショーケースで LPM 1.0 の例を見る、または技術ガイドでアーキテクチャを詳しく読むこともできます。
LPM 1.0 AI 動画におけるアイデンティティ保持
LPM 1.0 は多粒度のアイデンティティ条件付けを採用:グローバルな外観参照、多視点ボディ画像、表情エグゼンプラ。この細粒度の条件付けにより、LPM 1.0 AI モデルはプロ級のアイデンティティ保持を実現し、歯・表情のしわ・横顔のジオメトリといった幻覚的な細部を排除します。LPM 1.0 は 10 分以上の連続生成でアイデンティティ一貫性を保持します。
LPM 1.0 動画生成におけるマルチモーダル制御
テキストでキャラクターに何をするか伝える。音声で感情を形作る。参照画像で誰なのかを定義する。LPM 1.0 はテキスト・音声・画像の 3 つの自然な制御信号を 1 回の生成パスで統合し、LPM 1.0 AI のリアルタイム動画生成において、キャラクターパフォーマンスへの細やかな演出制御を可能にします。
LPM 1.0 によるゼロショットキャラクター汎化
LPM 1.0 はあらゆるキャラクタースタイルを入力として受け入れます — フォトリアルな人間、2D アニメ、3D ゲームキャラクター、非人型生物 — そしてファインチューニングやドメイン特化の訓練なしに、生き生きとした表現豊かな AI 動画パフォーマンスを生成します。LPM 1.0 AI は、単一のモデルですべてのビジュアルドメインに汎化します。
LPM 1.0 AI による全二重対話
LPM 1.0 は、全二重の対話動画生成を実現する最初のモデルです。キャラクターは精密なリップシンクと身体リズムで話しながら、ユーザーが話している間は同時に反応的なリスニングふるまい — うなずき、視線の動き、微表情 — を生成します。LPM 1.0 AI は、リアルタイムで真にインタラクティブな対話を生み出します。
LPM をオンラインで使う — インストール不要
LPM 1.0 をブラウザで使い、キャラクターパフォーマンス動画をプレビューできます。GPU・Python・アニメーションパイプラインの構築は不要。厳選デモと料金を確認してから、自分の動画を生成しましょう。LPM 1.0 プランを比較(年払いで月額 $9.9 から)。
LPM 1.0 AI 動画生成のコアケイパビリティ
LPM 1.0 は、共同設計されたデータパイプライン、モデルアーキテクチャ、ストリーミング推論最適化の上に構築されています。Large Performance Model は、他のどの AI 動画システムも提供できないケイパビリティを実現します — リアルタイム全二重対話から、無限長のアイデンティティ一貫生成まで。
ケイパビリティ
キャラクターフィデリティ — LPM 1.0 のマルチリファレンスアイデンティティシステム
LPM 1.0 AI は多粒度のアイデンティティ条件付けシステムにより、プロ級のキャラクターフィデリティを実現します。グローバル外観参照・多視点ボディ画像・表情エグゼンプラが、LPM 1.0 モデルに完全なアイデンティティ情報を提供し、見えない細部を幻覚する必要性を排除します。結果として、どんな長さでもキャラクターの外観を維持するアイデンティティ一貫 AI 動画生成が可能になります。
LPM 1.0 はどうやってリアルタイム AI 動画を生成するか — 技術パイプライン
LPM 1.0 は、リアルタイム AI 動画キャラクターパフォーマンス生成のために共同設計された、データパイプライン、モデルアーキテクチャ、ストリーミング推論最適化の上に構築されています。
LPM 1.0 のためのマルチモーダルデータセット構築
LPM 1.0 AI 動画生成は、厳格なフィルタリング、話す・聴くの音声映像ペアリング、パフォーマンス理解、アイデンティティ認識多参照抽出を通して構築された、マルチモーダルで人間中心のデータセットから始まります。この共同設計されたデータパイプラインが、LPM 1.0 の制御可能なキャラクターパフォーマンス生成の基盤を提供します。
Base LPM の訓練 — 17B Diffusion Transformer
Base LPM はマルチモーダル条件付けを通じて高度に制御可能でアイデンティティ一貫性のあるパフォーマンスを実現するように訓練された 17B パラメータの Diffusion Transformer です。LPM 1.0 AI は、アイデンティティ認識参照付きのキャラクター画像、音声信号、テキストプロンプトを同時に処理して、高品質なキャラクター動画パフォーマンスを生成します。
Online LPM 生成のための DMD 蒸留
Base LPM モデルは DMD(Distribution Matching Distillation)を用いて Online LPM 因果ストリーミング生成器に蒸留されます。これにより LPM 1.0 拡散プロセスはわずか 2 生成ステップに圧縮され、フル 17B モデルの品質を維持しつつ、0.35 秒の遅延でリアルタイム AI 動画生成を可能にします。
LPM 1.0 におけるオンラインストリーミング推論
推論時に LPM 1.0 AI は 3 つの会話状態でキャラクター動画を生成します:聴く(ユーザー音声からの反応的なうなずきと視線の動き)、話す(合成音声からのリップシンクパフォーマンス)、沈黙(テキスト条件付けからの自然なアイドルふるまい)。LPM 1.0 オンラインストリーミング生成器は、24fps の 480P/720P 動画をリアルタイムで生成します。
LPM 1.0 AI 動画生成 — 主要技術機能
LPM 1.0 を最先端の AI 動画キャラクターパフォーマンスモデルにする中核技術の革新群、既存システムを超えるケイパビリティを提供します。
LPM 1.0 における全二重 AI 動画
LPM 1.0 は真の全二重対話動画生成をサポートする唯一のモデルです。リアルタイム LPM 1.0 AI 動画でキャラクターが同時に話し聴き、ターン取りの遅延なしに自然な対話を生み出します。
LPM 1.0 生成における 0.35 秒遅延
LPM 1.0 は DMD 蒸留により、わずか 0.35 秒のエンドツーエンド遅延を実現します。Online LPM 因果ストリーミング生成器が拡散を 2 ステップに圧縮し、LPM 1.0 AI 動画のリアルタイム出力を可能にします。
LPM 1.0 AI 動画におけるアイデンティティ一貫性
LPM 1.0 は 10 分以上、漂流なしでアイデンティティ一貫キャラクター動画生成を維持します。参照画像を用いた多粒度条件付けにより、LPM 1.0 モデルはキャラクターの外観を無期限に保持できます。
480P/720P・24fps — LPM 1.0 出力品質
LPM 1.0 は 480P および 720P 解像度の AI 動画を 24fps で生成します。LPM 1.0 出力品質は、リアルタイムストリーミングインタラクションと高忠実度録画アプリケーションの両方をサポートします。
LPM 1.0 におけるマルチモーダル条件付け
LPM 1.0 AI はテキスト・音声・画像制御を 1 回の生成パスで統合します。テキストプロンプトが動きとふるまいを指示し、音声がリップシンクと感情を駆動し、参照画像が LPM 1.0 動画生成のキャラクターアイデンティティを定義します。
LPM 1.0 AI におけるゼロショット汎化
LPM 1.0 はあらゆるキャラクタースタイル — フォトリアル、アニメ、3D、非人型 — の表現豊かなパフォーマンス動画を、ファインチューニングなしで生成します。LPM 1.0 AI モデルは、単一のアーキテクチャですべてのビジュアルドメインに汎化します。
LPM 1.0 vs LiveAvatar vs OmniHuman — AI 動画パフォーマンスモデル比較
LPM-Bench ベンチマークは、評価されたすべての次元での LPM 1.0 の最先端のパフォーマンスを実証します。LPM 1.0 AI が遅延、全二重サポート、生成長、キャラクター汎化において LiveAvatar、Kling-Avatar-2、OmniHuman とどう比較されるかをご覧ください。
LPM 1.0 vs LiveAvatar — リアルタイムパフォーマンス
LPM 1.0 は LiveAvatar の 1 秒以上に対し 0.35 秒の遅延を実現します。LPM 1.0 AI は全二重対話(LiveAvatar はサポート外)、無限長生成(LiveAvatar は約 2 分制限)、ゼロショットキャラクター汎化をサポートします。LPM 1.0 モデルは LPM-Bench のあらゆる次元で LiveAvatar を上回ります。
LPM 1.0 vs OmniHuman — オンライン vs オフライン生成
OmniHuman は固定長出力でオフラインに動作します。LPM 1.0 AI は 0.35 秒の遅延でリアルタイムに動画を生成し、無限長生成をサポートします。LPM 1.0 はさらに全二重対話、歌唱パフォーマンス、あらゆるキャラクタースタイルへのゼロショット汎化をサポート — OmniHuman に完全に欠けているケイパビリティです。
LPM 1.0 vs Kling-Avatar-2 — アーキテクチャの優位性
Kling-Avatar-2 は約 0.8 秒の遅延、全二重サポートなし、最大 5 分の継続時間です。LPM 1.0 AI は 0.35 秒遅延、真の全二重対話、無限長生成を提供します。DMD 蒸留を伴う LPM 1.0 17B パラメータ Diffusion Transformer は、より小さなアーキテクチャでは到達できないケイパビリティを可能にします。
LPM 1.0 AI 動画生成の恩恵を受けるのは誰か
LPM 1.0 はリアルタイムでアイデンティティ一貫したキャラクターパフォーマンスを必要とするアプリケーションのビジュアルエンジンとして機能します。Large Performance Model は、対話 AI、ゲーミング、ストリーミング、アクセシビリティの次世代インタラクティブ体験を可能にします。
LPM 1.0 が動かす対話 AI エージェント
LPM 1.0 AI 動画生成はテキストベースのチャットボットを、人間らしいキャラクターパフォーマンスを持つビジュアル対話エージェントへ変えます。LPM 1.0 モデルは ChatGPT や Doubao などの A2A モデルとプラグアンドプレイで互換し、リアルタイムに話し・聴き・反応するキャラクター動画を生成します。
LPM 1.0 AI キャラクターパフォーマンスのゲーム NPC
ゲーム開発者は LPM 1.0 を使い、表現豊かな対話、感情的反応、自然なリスニングふるまいによる、リアルタイムでアイデンティティ一貫したパフォーマンスを提供する NPC を作成できます。LPM 1.0 AI 動画生成は缶詰アニメーションを真のキャラクターパフォーマンスに置き換えます。
LPM 1.0 を用いるバーチャル配信キャラクター
LPM 1.0 AI は、全二重対話、歌唱、感情表現でリアルタイムに演じるライブ配信キャラクターを実現します。LPM 1.0 モデルはフォトリアルからアニメまであらゆるキャラクタースタイルのアイデンティティ一貫動画を、事前録音アニメーションなしで生成します。
LPM 1.0 AI によるアクセシビリティと教育
LPM 1.0 AI 動画生成は教育の公平性を高め、コミュニケーションに課題のある人々のアクセシビリティを改善します。LPM 1.0 モデルは、ユーザーインタラクションにリアルタイムで自然に応答する表現豊かなバーチャルチューターやコンパニオンキャラクターを生成できます。
LPM 1.0 AI 動画生成 — パフォーマンス概要
LPM 1.0 を支える数字 — あらゆる代替手段に対してベンチマーク済みの、最大のリアルタイム AI 動画キャラクターパフォーマンスモデル
17B 最大のキャラクターパフォーマンスモデル
最大のキャラクターパフォーマンスモデル
0.35s 代替の 3 倍速い
代替の 3 倍速い
45min+ アイデンティティ漂流ゼロ
アイデンティティ漂流ゼロ
LPM 1.0 AI 動画生成について研究者の声
AI 動画生成研究コミュニティからの LPM 1.0 Large Performance Model に関する見解。
我々はパイプライン内のあらゆるアバターシステムに対して LPM 1.0 をテストしました。全二重ケイパビリティは前例がありません — 話している間に実際に「聴く」キャラクター。リアルタイムインタラクティブパフォーマンスのこのレベルに、他のどのモデルも近づきません。
Dr. Wei Chen, シニア CV 研究者、トップ 5 AI ラボ
Dr. Wei Chen
シニア CV 研究者、トップ 5 AI ラボ
LPM 1.0 を Unreal Engine 5 パイプラインに組み込みました。アニメ NPC と 3D キャラクターが、ファインチューニングなし — ゼロショットで動きました。0.35 秒の遅延は、リアルタイムカットシーン生成を初めて実現可能にします。
Takeshi Yamamoto, テクニカルディレクター、AAA ゲームスタジオ
Takeshi Yamamoto
テクニカルディレクター、AAA ゲームスタジオ
ChatGPT ベースのエージェントと LPM 1.0 を午後ひとつで接続しました。私たちのテキストチャットボットに、本当に反応する顔がついた — うなずき、考え、笑う。ユーザーは、本物の人間と話しているように感じると言います。30 分のセッションでもアイデンティティは完璧に保たれました。
Sarah Rodriguez, ML エンジニア、対話 AI スタートアップ
Sarah Rodriguez
ML エンジニア、対話 AI スタートアップ
LPM 1.0 に北京語のバラードと英語のロックを投げてみた — どちらも完璧に動きました。口の動きはメロディに従い、呼吸はリアルで、伸ばした音は持続する。訓練データに歌唱はなし。ぶっ飛んでます。
Marcus Liu, クリエイティブディレクター、デジタルメディアスタジオ
Marcus Liu
クリエイティブディレクター、デジタルメディアスタジオ
コミュニケーションに課題を持つユーザーにとって、入力をただ待つのではなく本当に「聴いてくれる」バーチャルコンパニオンの存在は、すべてを変えます。LPM 1.0 は、私たちが何年も構築しようとしてきた、応答性と共感性のある存在を生み出します。
Dr. Emma Larsson, HCI 研究者、アクセシビリティラボ
Dr. Emma Larsson
HCI 研究者、アクセシビリティラボ
45 分間連続のセッションを実行しました — キャラクターのアイデンティティは一度も漂流しませんでした。一度も。その事実だけで、パイプラインの事前録音アニメーションループはすべて陳腐化します。LPM 1.0 は漸進的な改善ではなく、カテゴリの転換です。
Alex Petrov, アニメーションディレクター、バーチャルプロダクション
Alex Petrov
アニメーションディレクター、バーチャルプロダクション
LPM 1.0 AI 動画モデルに関するよくある質問
リアルタイム AI 動画キャラクターパフォーマンス生成のための 17B パラメータ Diffusion Transformer、LPM 1.0(Large Performance Model)に関する一般的な質問。
0.35 秒のリアルタイムキャラクターパフォーマンスを支えるアーキテクチャ
1 つのモデルが、全二重対話、無限長アイデンティティ一貫性、ゼロショット汎化を — すべて 0.35 秒で — どうやって実現するのか?LPM 1.0 技術レポートが完全なパイプラインを 43 ページで明らかにします。このレベルのアーキテクチャ透明性はこの分野では稀です。
