LLM Integration

Local AI のセクションでは AI が何をするかを説明しました。このセクションでは、その内部の仕組みを解説します。Quira の AI 機能は llama.cpp（クロスプラットフォーム）と MLX（Apple Silicon）で動作します。モデルは初回起動時にダウンロードされ、ローカルに保存されます。

NL Query の内部動作

自然言語クエリを送信すると、Quira は Context Graph 上で RAG（Retrieval-Augmented Generation）パイプラインを使用します：

クエリ埋め込み — 質問が 384 次元の埋め込みベクトルに変換されます。
検索 — sqlite-vec が最もセマンティックに類似したノードを検索します。FTS5 がキーワードマッチで補完します。
コンテキスト組み立て — 取得されたノードの要約、エンティティ、メタデータが LLM のコンテキストウィンドウに組み立てられます。
引用付き生成 — LLM が取得されたコンテキストに基づいた回答を、必須のソース引用付きで生成します。

AI 機能のレイテンシ

AI 機能	トリガー	目標レイテンシ
ページ要約	ノード作成時に自動	< 2s
エンティティ抽出	ノード作成時に自動	< 1s
埋め込み生成	ノード作成時に自動	< 500ms
NL Query（100 ノード）	コマンドパレットからユーザーが実行	< 3s

← Previous: ストレージ (SQLite) Next: 開発環境セットアップ →