2016/10/15 機械学習 名古屋 第7回勉強会
後藤 俊介 ( @antimon2 )
シチュエーション¶
- キノコが10個ある。
- いくつかは安全なキノコで、いくつかは毒キノコ。
- できるだけ安全なキノコだけを選びたい。
- かつ、できる限りたくさんのキノコを選びたい。
例えば。¶
正解 ○ ○ ○ × × ○ × × × × 選択 ○ ○ ○ ○ ○ × × × × ×
表にしてみた。¶
安全なキノコ 毒キノコ 選んだキノコ 3 2 選ばなかったキノコ 1 4
正解率 (Accuracy)¶
$$ {\rm Accuracy} = \frac{3 + 4}{3 + 2 + 1 + 4} = 0.7 $$
安全なキノコ 毒キノコ 選んだキノコ 3 2 選ばなかったキノコ 1 4
適合率 (Precision)¶
$$ {\rm Precision} = \frac{3}{3 + 2} = 0.6 $$
安全なキノコ 毒キノコ 選んだキノコ 3 2 選ばなかったキノコ 1 4
再現率 (Recall)¶
$$ {\rm Recall} = \frac{3}{3 + 1} = 0.75 $$
安全なキノコ 毒キノコ 選んだキノコ 3 2 選ばなかったキノコ 1 4
F-値 (F1-Score)¶
$$ \begin{eqnarray} {\rm F}_1 &=& \frac{2}{\frac{1}{\rm Precision} + \frac{1}{\rm Recall}}\\ &=& \frac{2 \times {\rm Precision} \times {\rm Recall}}{{\rm Precision} + {\rm Recall}}\\ &=& 0.66666\dots \end{eqnarray} $$
混同行列 (Confusion Matrix)¶
安全なキノコ 毒キノコ 選んだキノコ 3 2 選ばなかったキノコ 1 4
True Positive¶
$$ {\rm TP} = 3 $$
安全なキノコ 毒キノコ 選んだキノコ 3 2 選ばなかったキノコ 1 4
- 正しく選ばれた事象の数(=安全なキノコを選んだ個数)
False Positive¶
$$ {\rm FP} = 2 $$
安全なキノコ 毒キノコ 選んだキノコ 3 2 選ばなかったキノコ 1 4
- 間違って選ばれた事象の数(=毒キノコを選んだ個数)
False Negative¶
$$ {\rm FN} = 1 $$
安全なキノコ 毒キノコ 選んだキノコ 3 2 選ばなかったキノコ 1 4
- 間違って選ばれなかった事象の数(=選ばなかったうちの安全なキノコの個数)
True Negative¶
$$ {\rm TN} = 4 $$
安全なキノコ 毒キノコ 選んだキノコ 3 2 選ばなかったキノコ 1 4
- 正しく選ばれなかった事象の数(=選ばなかったうちの毒キノコの個数)
混同行列 (Confusion Matrix) 改¶
+ - (+) TP FP (-) FN TN
評価指標の再定義¶
$$ {\rm Accuracy} = \frac{{\rm TP} + {\rm TN}}{{\rm TP} + {\rm FP} + {\rm FN} + {\rm TN}} $$$$ {\rm Precision} = \frac{\rm TP}{{\rm TP} + {\rm FP}} $$$$ {\rm Recall} = \frac{\rm TP}{{\rm TP} + {\rm FN}} $$$$ {\rm F}_1 = \frac{2{\rm TP}}{2{\rm TP} + {\rm FP} + {\rm FN}} $$
金メダル | 銀メダル | 銅メダル | |
---|---|---|---|
たぶん金メダル | 7 | 0 | 3 |
たぶん銀メダル | 1 | 8 | 1 |
たぶん銅メダル | 0 | 1 | 9 |
+ | - | |
---|---|---|
(+) | TP | FP |
(-) | FN | TN |
?
金メダル | 銀メダル | 銅メダル | |
---|---|---|---|
たぶん金メダル | 7 | 0 | 3 |
たぶん銀メダル | 1 | 8 | 1 |
たぶん銅メダル | 0 | 1 | 9 |
金メダル | 金メダルじゃない | |
---|---|---|
たぶん金メダル | 7 | 3 |
たぶん金メダルじゃない | 1 | 19 |
TP | FP | FN | TN | |
---|---|---|---|---|
金メダル | 7 | 3 | 1 | 19 |
銀メダル | 8 | 2 | 1 | 19 |
銅メダル | 9 | 1 | 4 | 16 |
金メダル | 銀メダル | 銅メダル | |
---|---|---|---|
たぶん金メダル | 7 | 0 | 3 |
たぶん銀メダル | 1 | 8 | 1 |
たぶん銅メダル | 0 | 1 | 9 |
TP | FP | FN | TN | |
---|---|---|---|---|
金メダル | 7 | 3 | 1 | 19 |
銀メダル | 8 | 2 | 1 | 19 |
銅メダル | 9 | 1 | 4 | 16 |
TP | FP | FN | TN | |
---|---|---|---|---|
金メダル | 7 | 3 | 1 | 19 |
銀メダル | 8 | 2 | 1 | 19 |
銅メダル | 9 | 1 | 4 | 16 |
TP | FP | FN | TN | |
---|---|---|---|---|
金メダル | 7 | 3 | 1 | 19 |
銀メダル | 8 | 2 | 1 | 19 |
銅メダル | 9 | 1 | 4 | 16 |
ライオン | ライオンじゃない | |
---|---|---|
たぶんライオン | 7 | 3 |
(未検出) | 9 | - |
ライオン | ライオンじゃない | |
---|---|---|
たぶんライオン | 7 | 3 |
(未検出) | 9 | - |
※私たちはまだライオンがウヨウヨいるサバンナにいます。
(=「ここにはライオンいない」という箇所を見付けて確実に少しずつ歩いて行けば良さげ?)
= 「大丈夫だと思ったところにライオンがいた!」という状況には遭いたくない。
= 「ライオンを見つけ出す」という作業に対して 漏れ(=検出漏れ)を少なくしたい。
↓
↑
「できる限り安全に!」⇔「再現率を上げろ!」
(=「とにかく方向決めてまっすぐ突っ切る」ことでこの場を抜け出せば良さげ?)
= 「気がついたら目の前にライオンがいた!」という状況だけには遭いたくない。
= 「ライオンを見つけ出す」という 見極め だけはしっかりしたい。
↓
↑
「多少の危険は覚悟で!」⇔「適合率を上げろ!」
ご清聴ありがとうございました。
おまけ
というか、シチュエーションその3+α
おしまい