Generator

3D人体生成

3D人体生成

2D画像から学習される拡散ベースの無条件3D人体生成モデルであるStructLDMについて説明します。

Stable Audio 2.0 音声生成 - メロディを口ずさむだけでAIが音楽を生成

Stable Audio 2.0 音声生成 - メロディを口ずさむだけでAIが音楽を生成

このモデルは、44.1 kHzステレオで最大3分間の高品質で一貫性のある音楽構造を持つフルトラックを生成可能です

『2024年人工知能指数報告』- 2.7.2  AudioのMusicGen:Metaの音声生成モデル

『2024年人工知能指数報告』- 2.7.2 AudioのMusicGen:Metaの音声生成モデル

AudioCraftは、音楽、サウンドエフェクト、圧縮といったすべての生成音声に関するニーズを満たす統合コードベースです。

『2024年人工知能指数報告』- 2.7.1 UniAudio:LLMに基づく音声生成モデル

『2024年人工知能指数報告』- 2.7.1 UniAudio:LLMに基づく音声生成モデル

音声生成は生成型AIの重要な要素です。

AI 3D生成 - AIUNIとPolycamの試用

AI 3D生成 - AIUNIとPolycamの試用

私たちは、3Dキャプチャは誰でも使えるべきだと信じているので、簡単にしました。 - Polycam

『2024年人工知能指数レポート』- 2.4 3D画像生成哪家強?

『2024年人工知能指数レポート』- 2.4 3D画像生成哪家強?

テキストからの3Dジオメトリーやモデルの生成は、AI研究者にとって大きな課題でした。

マイクロソフトTTS最新モデル

マイクロソフトTTS最新モデル

会話向けに9つのより現実的なAI音声が一般利用可能に

Champ - 人体画像の静止画からアニメーションを生成

Champ - 人体画像の静止画からアニメーションを生成

3Dパラメトリックガイダンスによる制御可能で一貫性のあるヒューマンイメージアニメーション