最近の記事

アンドレジ・カルパシーによる大規模言語モデル(LLM)技術の詳細解説(パート1)-【事前学習と推論】

アンドレジ・カルパシーによる大規模言語モデル(LLM)技術の詳細解説(パート1)-【事前学習と推論】

- はじめに - 事前学習データ (インターネット) - トークナイゼーション - ニューラルネットワークの入出力 - ニューラルネットワーク内部 - 推論

フランスのLLMチーム Mistralが発表した le Chat:毎日神々の戦いを観るような体験

フランスのLLMチーム Mistralが発表した le Chat:毎日神々の戦いを観るような体験

全新版 le Chat:生活と仕事のためのAIアシスタント

アップル AI テーブルランプ ELEGNT:ロボットを動かし、より自然で表現豊かな動きを実現

アップル AI テーブルランプ ELEGNT:ロボットを動かし、より自然で表現豊かな動きを実現

ELEGNT:非人型ロボットのための表現力があり機能的な動きのデザイン

吳恩達が最新発表したエージェント目標検出:アジェンティック・オブジェクト検出

吳恩達が最新発表したエージェント目標検出:アジェンティック・オブジェクト検出

推論駆動型物体検出:カスタムトレーニングの負荷なしでテキストプロンプトによる人間のような精度を実現

バイトダンスのOmniHuman-1:一枚の人体画像からリアルな人体ビデオを生成

バイトダンスのOmniHuman-1:一枚の人体画像からリアルな人体ビデオを生成

OmniHuman-1:ステージ1条件付きヒューマンアニメーションモデルの拡大を見直す

テキサス工科大学がまとめた研究者のAIツールリスト

テキサス工科大学がまとめた研究者のAIツールリスト

AIを活用した文献レビュー資源

アリババのEMO2:音声駆動型話者アバター生成技術

アリババのEMO2:音声駆動型話者アバター生成技術

EMO2: エンドエフェクタガイドによる音声駆動型アバター動画生成

Snapのワンダーランド:一枚の画像から3Dシーンを生成する技術

Snapのワンダーランド:一枚の画像から3Dシーンを生成する技術

ワンダーランド:単一の画像から3Dシーンをナビゲートする

OpenAIディープリサーチ:インテリジェントリサーチアシスタントが登場

OpenAIディープリサーチ:インテリジェントリサーチアシスタントが登場

推理を使用して大量のオンライン情報を合成し、複数ステップのリサーチタスクを完了するエージェント。