最近の記事 - Infiai

最近の記事

なぜモデルは「ステップごとの思考」が必要なのか - Andrej KarpathyによるLLMの詳細解説（Part 6）

なぜモデルは「ステップごとの思考」が必要なのか - Andrej KarpathyによるLLMの詳細解説（Part 6）

モデルが考えるためにトークンが必要な理由

2025-02-20

DeepSeek R1/ChatGPT o3/Grok3 思考各種大規模モデルがどのように思考するかの比較

DeepSeek R1/ChatGPT o3/Grok3 思考各種大規模モデルがどのように思考するかの比較

LLM 思考

2025-02-19

Grok3 - マスク氏が自称する宇宙最強のLLMモデル

Grok3 - マスク氏が自称する宇宙最強のLLMモデル

GROK 3はテトリスとビジュエルドを組み合わせることができました

2025-02-18

百度のHallo3 - 音声駆動の肖像画像アニメーション

百度のHallo3 - 音声駆動の肖像画像アニメーション

Hallo3: Diffusion Transformer Networksを使用した非常にダイナミックで現実的なポートレート画像アニメーション

2025-02-17

LLMの「自己認識」 - Andrej KarpathyによるLLMの詳細解説（Part 5）

LLMの「自己認識」 - Andrej KarpathyによるLLMの詳細解説（Part 5）

自分自身に関する知識

2025-02-16

ソニーのMMAudioモデル — 動画に音効果を付加

ソニーのMMAudioモデル — 動画に音効果を付加

MMAudioは、ビデオおよび/またはテキスト入力が与えられた場合に同期された音声を生成します。

2025-02-15

Andrej KarpathyによるLLMの詳細解説（Part 4）：幻覚（Hallucinations）

Andrej KarpathyによるLLMの詳細解説（Part 4）：幻覚（Hallucinations）

幻覚、道具の使用、知識/作業記憶

2025-02-14

アンドレイ・カルパシーによるLLMの詳細解説（パート3）：ポストトレーニング後訓練

アンドレイ・カルパシーによるLLMの詳細解説（パート3）：ポストトレーニング後訓練

事前学習からポストトレーニングへポストトレーニングデータ（会話）

2025-02-13

アンドレイ・カルパシーによるLLMの詳細解説（パート2）：GPT-2とLlama 3.1を用いた訓練と推論の理解

アンドレイ・カルパシーによるLLMの詳細解説（パート2）：GPT-2とLlama 3.1を用いた訓練と推論の理解

GPT-2: 訓練と推論 Llama 3.1ベースモデルの推論

2025-02-12

前のページ次のページ