最近の記事 - Infiai

最近の記事

SMooDi - AIによるリアルでスタイル化されたキャラクターの動き生成

SMooDi - AIによるリアルでスタイル化されたキャラクターの動き生成

今日は「SMooDi: Stylized Motion Diffusion Model」という論文を読みました。現在まだ

2024-07-22

アリババのEchoMimic - 肖像ビデオの生成

アリババのEchoMimic - 肖像ビデオの生成

EchoMimic - 編集可能なランドマーク条件付けを通じた生き生きとした音声駆動型肖像アニメーション

2024-07-20

アリババの意味認識モデルSenseVoiceと音声生成モデルCosyVoice

アリババの意味認識モデルSenseVoiceと音声生成モデルCosyVoice

人間とLLM間の自然なインタラクションのための音声理解および生成基盤モデル

2024-07-19

GoogleのStill-Moving：少量の静止参考画像を使用してパーソナライズされたビデオコンテンツを生成

GoogleのStill-Moving：少量の静止参考画像を使用してパーソナライズされたビデオコンテンツを生成

カスタマイズされたビデオデータなしでのカスタマイズされたビデオ生成に関する研究探求

2024-07-18

Googleの内部ツール Smart Paste - 自動で貼り付けたコードを調整して、コード作成のワークフローを簡素化

Googleの内部ツール Smart Paste - 自動で貼り付けたコードを調整して、コード作成のワークフローを簡素化

コンテキストに応じた調整を行うスマートペースト

2024-07-17

GoogleのMagic Insertは、ターゲット画像にドラッグアンドドロップすることでスタイルを認識し、現実的な挿入効果を実現します

GoogleのMagic Insertは、ターゲット画像にドラッグアンドドロップすることでスタイルを認識し、現実的な挿入効果を実現します

マジックインサート：スタイル認識型ドラッグアンドドロップ

2024-07-16

Google DeepMindのビデオ・トゥ・オーディオ研究 - ビデオに音声を自動生成

Google DeepMindのビデオ・トゥ・オーディオ研究 - ビデオに音声を自動生成

ビデオ用のオーディオ生成

2024-07-15

Dify - LLM アプリ開発プラットフォーム

Dify - LLM アプリ開発プラットフォーム

DifyはオープンソースのLLMアプリ開発プラットフォームです。

2024-07-12

ControlNetの著者が新プロジェクトPaintsUndoを公開 - 人類の絵画行動の基礎モデル

ControlNetの著者が新プロジェクトPaintsUndoを公開 - 人類の絵画行動の基礎モデル

人間の行動を理解して真のニーズに合わせる

2024-07-11

前のページ次のページ