最近の記事

Advertisement

Stable Audio 2.0 音声生成 - メロディを口ずさむだけでAIが音楽を生成

Stable Audio 2.0 音声生成 - メロディを口ずさむだけでAIが音楽を生成

このモデルは、44.1 kHzステレオで最大3分間の高品質で一貫性のある音楽構造を持つフルトラックを生成可能です

『2024年人工知能指数報告』- 2.7.2  AudioのMusicGen:Metaの音声生成モデル

『2024年人工知能指数報告』- 2.7.2 AudioのMusicGen:Metaの音声生成モデル

AudioCraftは、音楽、サウンドエフェクト、圧縮といったすべての生成音声に関するニーズを満たす統合コードベースです。

『2024年人工知能指数報告』- 2.7.1 UniAudio:LLMに基づく音声生成モデル

『2024年人工知能指数報告』- 2.7.1 UniAudio:LLMに基づく音声生成モデル

音声生成は生成型AIの重要な要素です。

『2024年人工知能指数報告』- 2.5 動画

『2024年人工知能指数報告』- 2.5 動画

動画生成とは、テキストや画像からAIを使用して動画を生成することを指します。

マイクロソフトがPhi-3小型言語モデルを発表(モバイル端末で実行可能)

マイクロソフトがPhi-3小型言語モデルを発表(モバイル端末で実行可能)

複雑な問題を解決する最善の方法は、児童書からヒントを得ることです。

AI 3D生成 - AIUNIとPolycamの試用

AI 3D生成 - AIUNIとPolycamの試用

私たちは、3Dキャプチャは誰でも使えるべきだと信じているので、簡単にしました。 - Polycam

『2024年人工知能指数レポート』- 2.4 3D画像生成哪家強?

『2024年人工知能指数レポート』- 2.4 3D画像生成哪家強?

テキストからの3Dジオメトリーやモデルの生成は、AI研究者にとって大きな課題でした。

『2024年人工知能指数レポート』- 2.1.1 SynthID多機能のデジタル透かしツール

『2024年人工知能指数レポート』- 2.1.1 SynthID多機能のデジタル透かしツール

AI生成画像の透かし加工と識別に使用される堅牢でスケーラブルなツール。