Conscience Technology
Researchresearch

Nora Hallucination Detector: 9Bモデルでフロンティア級ハルシネーション検出を達成

2026年4月12日

概要

RAGパイプラインにおけるLLM生成回答のハルシネーションを検出する軽量モデルです。FActScoreにインスパイアされたclaim-by-claim分解方式を採用しています。


主要結果

ベンチマーク評価(500サンプル、10ベンチマーク)

MethodAccuracyHallu-F1Faith-F1
Qwen3.5-9B (base)83.0%0.7570.869
Qwen3.5-9B + LoRA81.6%0.7740.845
GPT-5.469.8%0.6910.705

Claude 4.6一致率

MethodAgreementFPFN
Qwen3.5-9B (base)75.0%11312
Qwen3.5-9B + LoRA89.6%484
GPT-5.491.0%441

9Bモデルが22分の学習でClaude 4.6と89.6%の一致率を達成


アーキテクチャ

Base Model: Qwen3.5-9B — LoRA Rank 16, 510MBアダプター

学習: RTX 5090で22分、980サンプル

デプロイ

  • 4-bit量子化 = 16GB VRAM
  • GGUF Q4で6-8GBまで削減可能