ホテルオークラ第31期ワインアカデミー

ワイン

ホテルオークラのワインアカデミー第31期「各国ワインの捉え方」（全4回）に参加しました。4回の受講が無事終了したため、感じたことを簡単にまとめます。日常的にワインを飲む習慣や、何か資格取得の必要などはまったくなく、「教養としてワインを知ろう」…

#The Okura Tokyo #ワインアカデミー

2021-10-16

2020年に読んだ21冊+観た1本

読書映画

2020年に読んだ本と観た映画の紹介です。そもそもですが読んだ本、観た映画の定義が人によってかなり違う気がします。本なら紙の書籍、映画なら映画館で観る必要はなく、Amazonなどのサブスクを利用すれば全編にわたって目を通さなくても好きな箇所だけ楽し…

2021-09-25

『Python実践データ分析100本ノック』を2周やってみて調べたこと

Python

Python実践データ分析100本ノック作者:下山輝昌,松田雄馬,三木孝行秀和システムAmazon「とりあえずPython勉強しないとやばい」という焦りと勢いに任せ、100本ノック（正確には60本ノック）やりました。第1,2章のデータ加工、第3-5章の機械学習、第10章の言…

#Python #pandas #100本ノック

2021-09-07

北海道・大雪山で学んだ登山道整備の意義

登山

2021年7月~9月にかけて北海道・大雪山での登山道整備プログラムに参加しました。登山道整備とは大雪山での登山道整備に参加した経緯登山道整備プログラムの内容とスケジュールオンライン講習の振り返り大雪山の登山道浸食と管理体制の課題近自然工法と…

2021-08-27

実験計画法（５）2水準の直交表

統計学

直交表とは実験に用いる因子の数が多くなると、水準との組み合わせの数が増え、必要な実験回数が増えてしまう。例えば因子が10個、水準が2つの場合、因子と水準との組み合わせの数はとなり、少なくとも回の実験が必要になってしまう。企業の製品開発などで…

#実験計画法 #直交表 #統計検定準1級

2021-08-02

【2021年7月】統計検定準1級の受験振り返り【不合格】

統計学

統計検定を受験しました試験の手ごたえやったことこれからやること CBT方式が始まってた統計検定を受験しました先月6月21日（日）統計検定準1級を受けてきました。2020年の試験が新型コロナウイルス対策のため中止になり、今年の受験に向けてゆるゆると…

#統計検定 #準1級 #受験結果

2021-07-07

実験計画法（４）分割法

統計学

分散分析、乱塊法に引き続き実験計画法についてのメモ。分割法の考え方完全無作為法による1次因子の繰り返し乱塊法による1次因子の繰り返し分割法の検定精度参考文献分割法の考え方あるコーヒー農園で次のような実験を行う。3つの品種（A,B,C）と2つ…

#実験計画法 #分割法

2021-07-01

実験計画法（３）乱塊法

統計学

乱塊法の構造式（モデル）乱塊法の検定精度参考文献乱塊法の構造式（モデル）乱塊法では実験条件が同一であるブロック因子を、実験結果に影響を与える1つの因子だと考える。分散分析の構造式にブロック因子を足せばよい。一元配置分散分析の構造式は、 …

#実験計画法 #分散分析 #乱塊法 #統計検定準1級

2021-06-25

実験計画法（２）分散分析

統計学

分散分析とは一元配置分散分析構造式（モデル）帰無仮説検定統計量の算出水準ごとの平均値の点推定（補足）TSS = BSS + WSSの証明二元配置分散分析構造式（モデル）分散分析表帰無仮説と検定統計量参考文献分散分析とは分散分析は実験計画法の1…

#実験計画法 #分散分析 #統計検定準1級

2021-06-24

実験計画法（１）フィッシャーの三原則と乱塊法

統計学

実験計画法フィッシャーの実験の3原則 3原則を満たす乱塊法のイメージ実験計画法実験計画法（experimental design）とは、取り上げる対称についての結果とそれに影響しそうな要因との関係を調べるため、時間・コスト等の制約を考慮しながら計画的に実験を…

#実験計画法 #フィッシャーの3原則 #統計検定準1級

2021-06-19

マルコフ連鎖

統計学

推移確率行列定常分布確率推移のイメージ極限分布 MCMC メトロポリス法推移確率行列確率変数がマルコフ連鎖であるとき、1期前の状態のみに依存し、それ以前の状態には依存しないことを意味する。過去のすべての履歴が直前の状態に集約される、とも言え…

#マルコフ連鎖 #マルコフ連鎖モンテカルロ

2021-06-18

ベイズ判別

統計学

条件付き確率とベイズの定理正規分布のベイズ判別判別関数参考文献条件付き確率とベイズの定理ベイズ判別の基本的な考え方はベイズの定理に基づく。例えばある患者の発熱という症状について風邪かインフルエンザのどちらの原因で生じたかを判断したいと…

#多変量解析 #ベイズ判別

2021-06-16

サポートベクターマシン

線形判別ではデータの平均ベクトルや分散共分散行列を用いて判別法を構成した。サポートベクターマシンはこれらの判別法とは全く異なる考え方に基づく。サポートベクターマシン（SVM）最適化問題の立式サポートベクターマシン（SVM）のカーネル法高次元…

#多変量解析 #判別分析 #サポートベクターマシン

2021-06-13

クラスター分析（階層型分類法の基本事項）

統計学

クラスター分析は異なる性質が混ざった多数の個体を、個体間の類似度に基づいて似たものの集まり（クラスター）を作るための手法。判別分析ではどの群に属するかがあらかじめわかっているデータに基づいて判別関数（判別方法）を構成したのに対し、クラスタ…

#多変量解析 #クラスター分析

2021-06-12

判別分析（2）マハラノビスの距離

統計学

フィッシャーの線形判別関数は、青（1群）と赤（2群）から観測されたデータを、変数の線形結合で表される軸上へ射影し、それぞれの群の分離度を表す群間分散と、各群内のデータのばらつき度合いを示す郡内分散の比を最大にする軸（直線）を最適な射影軸とす…

#多変量解析 #判別分析 #マハラノビスの距離

2021-06-09

判別分析（1）線形判別関数

統計学

線形判別分析判別分析の目的は量的なデータを元に質的な結果を予想すること。例えば身長や体重、血圧といった量的なデータを元に、その人が健康か不健康かを判断する。線形判別とはデータを直線で分け、データが直線の左右どちらにあるかを判別する。図1は2…

#多変量解析 #判別分析 #線形判別関数

2021-06-02

【統計検定準1級】因子分析の直感的理解

統計学

主成分分析と因子分析の違い 1因子モデル 1因子モデルの図示因子についての仮定条件連立方程式を解く 2因子モデル 2因子モデルの図示因子についての仮定条件共通性独自性因子の回転参考文献主成分分析と因子分析の違い主成分分析と同様、因子分析も…

#多変量解析 #因子分析

2021-05-31

【統計検定準1級】主成分分析の直感的理解

統計学

最大化問題の立式最大化問題を解く寄与率データの標準化主成分負荷量（因子負荷量）主成分得点参考文献最大化問題の立式主成分分析の目的はデータの要約。の2変量のデータの散布図に、直交する2直線を引く。図1このデータの特徴は座標という2次元の…

#多変量解析 #主成分分析

2021-05-30

【統計検定準1級】線形回帰モデルと正則化

統計学

線形回帰モデルの問題点過学習を避けるための方法変数増減縮小推定次元削減正則化 L1(Lasso)正則化とL2(Ridge)正則化 Elastic Net推定参考 2022/08/27 統計検定準1級の学習時に内容修正線形回帰モデルの問題点回帰モデルの説明変数の数が大きくなり…

#統計検定 #統計検定準1級 #正則化

2021-05-28

【R】特定の文字の含有有無によるダミー変数の作成[paste][str_detect]

R

アンケートの自由記述欄などの文字列のデータに対して、特定の文字列を含むかどうかでダミー変数を作成する場合のコード。例えば頻出語句やキーワードなどをあらかじめ指定しておけば、アンケート回答者の属性にとって頻出傾向の違い等を分析することができ…

#R #RStudio

2021-05-27

【R】記述統計量の算出[summary][describe][describeBy]

R 統計学

記述統計量（基本統計量）を算出する方法。最もオーソドックスなのはsummary関数。Rのデフォルトデータセットのirisを使う。連続値データは四分位点、カテゴリカルデータはサンプル数が表示される。 > data(iris) > summary(iris) Sepal.Length Sepal.Width …

#R #RStudio

2021-05-26

【R】分位数を決めてデータをカテゴリー化する[quantile][cut]

R

分位数に従ってデータのカテゴリー化（連続値→離散値）する方法。データの情報量を落とす操作なので使う場面は相当限られる（なんらかの理由で表ではなくグラフを作成する場合など？） [quantile]を使ったデータのカテゴリー化 Rのデフォルトデータセットiri…

#R #RStudio

2021-05-25

【R】ゼロを含む先頭n桁を取り出す[formatC][substr]

R

連番の数字の先頭2桁を取り出すときのコード。例えばxを995から1005までの整数とし、ゼロを含む先頭2桁を取り出す。 > x <- 995:1005 > x [1] 995 996 997 998 999 1000 1001 1002 1003 1004 1005 > class(x) [1] "integer" はじめの5つのみ3桁の整数なので…

#R #RStudio