記事検索

グラフの泉

https://jp.bloguru.com/math

フリースペース

分類問題は当たればよいというものではない。

スレッド
分類問題は当たればよいというも...
先日、東京で緊急地震速報の誤報があった。
地震速報がなったが、実際は相当する揺れはなく誤報であったという。
本当にあったときに速報されれば、ないときの誤報は許されるとの意見が身近にあったが、もしそれが頻発すればオオカミ少年的になっても困るが、ひとまずはそんな心配もいらないといったところなのだろうか。

さて、先日の記事で分類問題について書いたが、読書から「結局は正解率が高ければいいんじゃないの!?」という意見を頂いた。

これはやはりもっとほり下げねばならない。


では、極端な例をあげよう。
Aさんは、地震速報のシステムをつくって、ある周波数を検知して通知を出すか出さないかを判定させる構造である。3か月運用した結果が図の通りであるとしたときに、正解率は95%でした。みなさんが地震速報システムを買う都合があったとき、このシステム買いますか!?

先日も書きましたが、解釈は人間がするものなので正解はそれぞれでしょうが、私なら100%買いません。1番の理由はならすべきタイミングでアラートが鳴るのが15分の5、つまり33%・・・。

そもそも、アラートを流した場合と流さない場合が15、285と差が大きいこのデータは不均衡データとも呼ばれ、このような場合正解率のはあまり意味をなさなくなります。

この場合、0~1の範囲で値をとる、適合率、再現率、またこれらを用いたF値を使って評価することがあります。ちなみに今回の表のF値は0.4と決して高くはありません。


冷静に考えてみると、アラートが鳴って地震が起きる、アラートが鳴らなくて地震が起きないとでは、定性的にみても1回の価値が違いますよね。
このように分類問題とは、さまざまな見方があるのだ。

ワオ!と言っているユーザー

  • ブログルメンバーの方は下記のページからログインをお願いいたします。
    ログイン
  • まだブログルのメンバーでない方は下記のページから登録をお願いいたします。
    新規ユーザー登録へ