最近の記事

Advertisement

SMooDi - AIによるリアルでスタイル化されたキャラクターの動き生成

SMooDi - AIによるリアルでスタイル化されたキャラクターの動き生成

今日は「SMooDi: Stylized Motion Diffusion Model」という論文を読みました。現在まだ

アリババのEchoMimic - 肖像ビデオの生成

アリババのEchoMimic - 肖像ビデオの生成

EchoMimic - 編集可能なランドマーク条件付けを通じた生き生きとした音声駆動型肖像アニメーション

アリババの意味認識モデルSenseVoiceと音声生成モデルCosyVoice

アリババの意味認識モデルSenseVoiceと音声生成モデルCosyVoice

人間とLLM間の自然なインタラクションのための音声理解および生成基盤モデル

GoogleのStill-Moving:少量の静止参考画像を使用してパーソナライズされたビデオコンテンツを生成

GoogleのStill-Moving:少量の静止参考画像を使用してパーソナライズされたビデオコンテンツを生成

カスタマイズされたビデオデータなしでのカスタマイズされたビデオ生成に関する研究探求

Dify - LLM アプリ開発プラットフォーム

Dify - LLM アプリ開発プラットフォーム

DifyはオープンソースのLLMアプリ開発プラットフォームです。

ControlNetの著者が新プロジェクトPaintsUndoを公開 - 人類の絵画行動の基礎モデル

ControlNetの著者が新プロジェクトPaintsUndoを公開 - 人類の絵画行動の基礎モデル

人間の行動を理解して真のニーズに合わせる