顔98キーポイント認識
顔98キーポイント認識は、顔画像から眉、目、鼻、口、顔輪郭などの98箇所の特徴点を高精度に検出するAIアルゴリズムです。顔認証の高精度化、顔美顔・編集エフェクト、表情分析、口元認識など、顔関連アプリケーションの基盤技術です。
アルゴリズム概要
顔検出とキーポイント推定の2段階で構成されます。
- 顔検出:画像から顔領域を特定
- 98キーポイント検出:眉(×10)、目(×10)、鼻(×9)、口(×20)、顔輪郭(×33)、瞳孔(×2)などの計98点を検出
性能指標
| データセット | 誤差(NME %) |
|---|---|
| 300W | 2.78 |
| COFW | 3.08 |
| AFLW | 1.42 |
エッジAI基板(RV1126B)実行効率
| 処理段階 | モデルサイズ | 処理時間 |
|---|---|---|
| 顔検出(face_detect) | 44.23MB | 17ms |
| 98キーポイント検出(face_landmark98) | 10.88MB | 23ms |
| 合計 | 55.11MB | 約40ms |
主な特徴
- 高密度キーポイント:顔全体の98点を高精度に検出
- 多点ベンチマーク:300W(NME 2.78)、COFW(NME 3.08)、AFLW(NME 1.42)
- リアルタイム性能:検出+キーポイント合計で約40ms
- 多様な応用:顔認証、美顔、表情分析、視線推定、3D顔再構成
ユースケース
- 高精度顔認証システム(顔の姿勢補正による精度向上)
- 美顔・ビューティーアプリ(顔パーツ単位のメイク・補正)
- 表情分析・感情認識
- ARフェイスフィルター(SNSエフェクト)
- 顔の3Dモデル再構成
- 口元認識(読唇、発話検出)
- 運転者の眠気・わき見検知
エッジAI基板への実装
RV1126B の NPU を用いて、顔検出 17ms、98キーポイント 23ms の合計約40msで処理。リアルタイム映像に対しても追従可能なパフォーマンスです。