LLM Integration
Local AI のセクションでは AI が何をするかを説明しました。このセクションでは、その内部の仕組みを解説します。Quira の AI 機能は llama.cpp(クロスプラットフォーム)と MLX(Apple Silicon)で動作します。モデルは初回起動時にダウンロードされ、ローカルに保存されます。
NL Query の内部動作
自然言語クエリを送信すると、Quira は Context Graph 上で RAG(Retrieval-Augmented Generation)パイプラインを使用します:
- クエリ埋め込み — 質問が 384 次元の埋め込みベクトルに変換されます。
- 検索 — sqlite-vec が最もセマンティックに類似したノードを検索します。FTS5 がキーワードマッチで補完します。
- コンテキスト組み立て — 取得されたノードの要約、エンティティ、メタデータが LLM のコンテキストウィンドウに組み立てられます。
- 引用付き生成 — LLM が取得されたコンテキストに基づいた回答を、必須のソース引用付きで生成します。
AI 機能のレイテンシ
| AI 機能 | トリガー | 目標レイテンシ |
|---|---|---|
| ページ要約 | ノード作成時に自動 | < 2s |
| エンティティ抽出 | ノード作成時に自動 | < 1s |
| 埋め込み生成 | ノード作成時に自動 | < 500ms |
| NL Query(100 ノード) | コマンドパレットからユーザーが実行 | < 3s |
このページは役に立ちましたか?