ハコヒゲズ?

シベリウス&シェーンベルク:ヴァイオリン協奏曲

シベリウス&シェーンベルク:ヴァイオリン協奏曲


 学生に偶有性の話をしたあとに、MRさんとの面会(学生にとっては実習)も行った。「臨床の論文そのものをもってくるメーカーが一社もないことに驚いた!」と漏らした学生から、「やはりハコヒゲズって、使えるんですか?」と質問が飛び出した。

 ハコヒゲズ?

 聞いてみると、母集団の分布特性に限らずそのデータ値そのものをわかりやすく表現する手法のようだ。

 よかった。私に、人の話を聞く余裕があって。50%は未知という偶有性の構えの賜物である。

 そして、私は、先週間違えて購入したヒラリーハーンのヴァイオリンを思い出した。 本当は、三菱地所のジャーナルで、ギタリストの村治佳織さんが毎朝聴いているというハーンのCDを購入するつもりが、間違えて別のジャケット「シベリウスシェーンベルク:ヴァイオリン協奏曲」を買ってしまったのだ。朝の目覚めとはほど遠く、ヒッチコック映画のいちばん怖いシーンで使ってほしい曲ばかり。諦めずに最後まで聴いて、気がついた。ヴァイオリンの本気。

 負を知って、生を知る。今年の春樹も1Q84である。


 そして、私は「ヒコヒゲズ」も受け入れた。

・箱ひげ図(箱髭図、はこひげず、box plot)とは、ばらつき のデータをわかりやすく表現するための統計学的グラフ。
・特に品質管理で盛んに用いられる。
・一般的なジョン・テューキーの方式では、重要な5種の要約統計量 である、最小値、第1四分位点 、中央値 、第3四分位点と最大値を表現する。

 つまり、母集団 の特性によるさまざまな確率分布 のような仮定に関係なく、データの分布を表現することができる!箱の各部分の間隔から分散 や歪度 の程度、また外れ値 (これは後述のように箱ひげ図の方式により異なる)を知ることもできる。


具体例 (wikipediaより)

+-----+-+
* o |-------| + | |---|
+-----+-+
number line
0 1 2 3 4 5 6 7 8 9 10

このデータセットから次のことがわかる:
最小値(min) = 5。
第1四分位点(Q1) = 7。
中央値(第2四分位点、Med) = 8.5。
第3四分位点(Q3) = 9。
最大値(max) = 10。
平均値 = 8。
IQR(interquartile range) = Q3 − Q1 = 2
3.5という値は"軽度の"外れ値、つまりQ1よりも 1.5×IQR から 3×IQR だけ下にある。
0.5という値は"極端な"外れ値、つまりQ1よりも 3×IQR 以上下にある。
外れ値以外の最小値は5。
データは左に歪んでいる(負の歪度)。


気づき)
・ふむ。実習でもしないと、実用性のほどはわからない。
・生データがこのように表現できることは、感動
・まだまだ知らないことがある。


これから)医療安全委員会


目覚めには、こちらのヒラリーハーン「バッハ:ヴァイオリン協奏曲集」を

バッハ:ヴァイオリン協奏曲集

バッハ:ヴァイオリン協奏曲集