記事検索

グラフの泉

https://jp.bloguru.com/math

フリースペース

バーチャートレース3(大学生の数)

スレッド
バーチャートレース3(大学生の...
バーチャートレースにすっかりはまってしまった。
毎度、都道府県の比較をするが、東京一極集中なのが年を追うごとによくわかる。

e-stat  大学・大学院生の数より
https://dashboard.e-stat.go.jp/timeSeries



大学に入りやすくなった現代において、大学の価値をあらためて考えることが、地方の教育の課題ではないかと、勝手ながらに思う。

ワオ!と言っているユーザー

バーチャートレース2(出生数)

スレッド
バーチャートレース2(出生数)

ワオ!と言っているユーザー

バーチャートレース1(人口)

スレッド
バーチャートレース1(人口)
Youtubeでよくみる、棒グラフが競っているやつ、バーチャートレースというらしい。
とても面白いので試してみた。

flourishというサービスでつくれるのだが、既定のEXCELフォーマットをアップロードするだけでとても簡単だ。

e-statより
国勢調査 / 時系列データ / CSV形式による主要時系列データ
を使ってみる。



第2次世界大戦で一度減り、それ以降急加速しているのがよくわかる。

ワオ!と言っているユーザー

今年は雨が多かった

スレッド
今年は雨が多かった
東京に住んでいて、例年になく7月の雨量が多かったと感じる。
庭で育てている植物にほぼ水をあげなくてもよい1か月だった。

そして、地方では熊本や山形など豪雨災害にもまわれた方もいた。
はやい復興がのぞまれるとともに、なにかできることがあれば支援していきたいと思う。

さて、近年豪雨災害が多くなったと感じるとともに今回の災害は例外的な雨量であったのか、人吉の雨量を見てみたいと思う。

気象庁
過去の気象データ・ダウンロードより
http://www.data.jma.go.jp/gmd/risk/obsdl/

過去40年分の7月の降水量のデータのみを抽出しているのだが、月合計の雨量もさることながら、日最大雨量が大きいのが災害をもたらした要因として大きいだろう。
月合計も日最大もある程度の相関関係がみられるわけであるが、2006年も今年と似たような傾向であったことがわかる。調べてみると、やはりこのときも豪雨被害は大きかったようだ。
また、1983年やも九州南部では豪富被害があったようだ。グラフから見るに人吉では月降水量も高いが傾向線に対しては低い。それより日降水量が高いことがわかる。このような今年に比べて極端な年も過去にはあったことがわかる。


毎年とまで言わなくとも、10数年に1度ペースで起こっている水害について、さまざまな都市での対策について、他人事ではなく自身の住んでいる地域においても真剣に考えていく必要があるだろう。

ワオ!と言っているユーザー

子供が増えるには・・・、広い視野で考えたい・・・。

スレッド
子供が増えるには・・・、広い視...
後輩の結婚パーティーがあった。
同席の女性も結婚予定らしかったのだが、アラフォーだから子供は一人でいいとのことを話していた。

東京都
明治33年~平成29年 東京都全体 出生数・死亡・死産・婚姻・離婚・合計特殊出生率・平均初婚年齢
https://catalog.data.metro.tokyo.lg.jp/dataset/t000010d0000000009/resource/39896b2e-98a5-43c6-8efc-2bc0423e0e5b


上記から初婚年齢と合計特殊出生率の推移を見てみた。
合計特殊出生率は、一人の女性が出産可能とされる15歳から49歳までの出産数の平均だそうだ。単純に初婚年齢の推移とならべると関連がありそうな気がする。

初婚年齢が上がっているのは、女性の社会参画など多くの影響がありそうだ。
経済成長の過程もあり、多くの影響があるので、これらに因果があるというのはおおざっぱな議論だろう。ただし、データの関連性があることは否定できない。

私も親ながらおもうのは、自治体の子育て支援サービスが豊富になれば2人目、3人目を考えられる現実的な想像ができる。もちろん出産は命懸けだから肉体的な問題はあるのだろうが、初婚年齢があがっても合計特殊出生率があがっていくような社会であったほしいものだ・・・、と思った話題だった。

ワオ!と言っているユーザー

メタボ体質に地域差はあるのか!?

スレッド
メタボ体質に地域差はあるのか!... メタボ体質に地域差はあるのか!...
アラフォーと呼ばれる年になり、うまれてはじめて腹がでてきた。
かなりショックだ。知人に「東京はうまいものいっぱいあるし、普段の生活でふとりやすいんじゃない。」といわれた。なぐさめなのか?
そして、北海道出身のその知人は「北国出身はスリムが多いんだよ」ともいわれた。食糧難なわけでもないしそんなことあるのか?

参考となるようなデータがあったので早速みてみた。
DATA●GO.JP
特定健康診査・特定保健指導・メタボリックシンドロームの状況_都道府県別一覧
https://www.data.go.jp/data/dataset/mhlw_20170209_0103
※日本地図は濃い色の都道府県が割合が大きい
※棒グラフは太線が該当者割合、細線が予備軍割合

メタボの人とその予備軍の割合データだそうだ。かなり尖ったデータだ。

もちろん、これを見て地域差があるというつもりはないし、東京はかなり下だぜと勝ち誇ることもない。結局自分の腹をひっこめるために明日からランニングをしようと思っただけだ。

ワオ!と言っているユーザー

分類問題は当たればよいというものではない。

スレッド
分類問題は当たればよいというも...
先日、東京で緊急地震速報の誤報があった。
地震速報がなったが、実際は相当する揺れはなく誤報であったという。
本当にあったときに速報されれば、ないときの誤報は許されるとの意見が身近にあったが、もしそれが頻発すればオオカミ少年的になっても困るが、ひとまずはそんな心配もいらないといったところなのだろうか。

さて、先日の記事で分類問題について書いたが、読書から「結局は正解率が高ければいいんじゃないの!?」という意見を頂いた。

これはやはりもっとほり下げねばならない。


では、極端な例をあげよう。
Aさんは、地震速報のシステムをつくって、ある周波数を検知して通知を出すか出さないかを判定させる構造である。3か月運用した結果が図の通りであるとしたときに、正解率は95%でした。みなさんが地震速報システムを買う都合があったとき、このシステム買いますか!?

先日も書きましたが、解釈は人間がするものなので正解はそれぞれでしょうが、私なら100%買いません。1番の理由はならすべきタイミングでアラートが鳴るのが15分の5、つまり33%・・・。

そもそも、アラートを流した場合と流さない場合が15、285と差が大きいこのデータは不均衡データとも呼ばれ、このような場合正解率のはあまり意味をなさなくなります。

この場合、0~1の範囲で値をとる、適合率、再現率、またこれらを用いたF値を使って評価することがあります。ちなみに今回の表のF値は0.4と決して高くはありません。


冷静に考えてみると、アラートが鳴って地震が起きる、アラートが鳴らなくて地震が起きないとでは、定性的にみても1回の価値が違いますよね。
このように分類問題とは、さまざまな見方があるのだ。

ワオ!と言っているユーザー

PCR検査の精度

スレッド
PCR検査の精度
コロナ関連のニュースを見てもPCRを拡大すべきか、否かという話題がつきない。
これについて一つの考え方を示してみる。

もし東京都民全員を検査するのであればと仮定する。
・都民は1400万人
 →https://www.metro.tokyo.lg.jp/tosei/hodohappyo/press/2020/07/02/01.html
・陽性者は7%いる
 →https://stopcovid19.metro.tokyo.lg.jp/
  7月31日都内の感染状況より陽性率を参考にしている。
・感度は70%(陽性者のうち検査で正しく陽性と判定できる割合)
 →https://www.primary-care.or.jp/imp_news/pdf/20200311.pdf
・特異度は99%(陰性者のうち検査で正しく陰性者と判定できる割合)
 →https://www.primary-care.or.jp/imp_news/pdf/20200311.pdf

これを表にした混同行列をみてもらいたい。
検査で正しく評価されているのは、
陽性-感染者   686,000
陰性-非感染者  128,89,800
合計       13,575,800
上記合計を都民1400万人で割ると、約97%になる。

正解率約97%の検査を都民全員にすべきかどうかということを単純に考えてしまいますが、このような分類問題において正解率は鵜呑みにしてはいけない。

真陽性者686,000人は要治療だろうし、真陰性者12,889,800人は治療不要である。それより、3%の誤りの内訳を考えた方がよい。
A.偽陽性者は130,200人で本当は陰性なのに、治療を行うことになる。
B.偽陰性者は294,000人は本当は陽性なのに、治療を行わないことになる。

Aはよくニュースで耳にする「医療崩壊」の要因になってしまうだろう。Bはそもそもの感度からして生じる可能性がわかっているので、複数回の検査をして減らしていくしかないだろう。いずれにしても検査数が増えるので、医療負担は増すことになる。


全員検査とか、希望者検査とか、持病持ちの人検査とかさまざまなフレーズを聞くが、データを解釈して最善を判断するのは人の仕事だ。政治力に期待したい。

ワオ!と言っているユーザー

地方の学校

スレッド
地方の学校 地方の学校 地方の学校
先日、妻と地方は学校は学校数や教員数が少なくて大変だなー、と言っていたので気になった。

文部科学統計要覧 平成30年版
学校教育総括  
https://www.mext.go.jp/b_menu/toukei/002/002b/1403130.htm

↑から生徒数に対する学校の数と教員数を可視化してみた。
注意してみるのは傾向線はあくまで全国傾向なので、地域差を語るには材料不足だが、それでも教員数はかなり相関が高いことがわかる。

北海道の教員数、学校数が多いのはやはり面積の問題だろう。
学校数がおおければ教員も多くなるのは想像が容易だが、生徒あたりに対する教員数もきになるので、生徒数を学校数で割った数に対する教員数も比較してみた。

傾向としては指数関数的な様子もあるが、それはともかく北海道は生徒当たりに対する教員数が多い傾向だ。

妻にイメージで語らない方がよいと伝えることにしよう。

ワオ!と言っているユーザー

東京都のコロナ患者を可視化してみた

スレッド
東京都のコロナ患者を可視化して...
東京都オープンデータカタログにて「東京都 新型コロナウイルス陽性患者発表詳細」とのオープンデータが発表されている。
(https://catalog.data.metro.tokyo.lg.jp/dataset/t000010d0000000068)


中身は欠損が多く、あまり詳細データとして扱いにくいのだが、ひとまず患者数推移と移動平均をだしてみた。

年代とみると、20~40歳までの働き盛りの人の陽性者が多いのがわかるが、これをどう解釈するかはその他のデータをきちんと見ていく必要があるだろう。

ワオ!と言っているユーザー

  • ブログルメンバーの方は下記のページからログインをお願いいたします。
    ログイン
  • まだブログルのメンバーでない方は下記のページから登録をお願いいたします。
    新規ユーザー登録へ