乱数にコクを出す方法について - Togetter togetter.com/li/1044668 @togetter_jpより これを思い出した。
2020-04-14 09:28:59乱数サイは20面体ダイスに0-9が2セット記されてるものらしいので、20面ダイスの下一桁を使えばいける。(なんで10面ダイスじゃないんだろう。安定しないのか?)
2020-04-14 09:30:46ランダムサンプリング応用 等間隔サンプリング:乱数が1個で済む。サンプリングフレームに規則性があるとやべーことになる。 層別ランダムサンプリング:抽出枠を年齢・職業etcでグループ分けして、各グループ内でランダム抽出。ネイマン配分法ではばらつきの大きいグループの抽出率を高くしたりする
2020-04-14 09:38:34多段ランダムサンプリング:いきなりサンプル単位でランダム抽出するのではなく、市町村→選挙区→世帯みたいなかんじで段階を踏んでいく
2020-04-14 09:39:344級テキスト終わりー!さすが中学生くらい対象、すぐ終わったわ。すぐ終わったけど知らんことボロボロ出てきたわ。やってよかった。 今日3級のテキストと過去問集が届くので、明日は念のため4級過去問やって、3級に入ります。
2020-04-14 09:47:16フルタイム休業6日目〜。 とりあえず復習がてら統計検定4級の過去問を解く。ケアレスミスでボロボロ落としつつも合格点は取った。試験は練習が大事だということを思い出した。
2020-04-15 09:28:293級の過去問、すでに合格ラインには載っている。標準偏差、相関あたりの知識を入れれば余裕っぽい。 ただし、高校数学必須な問題が出てきたので最悪数学をガチでやり直す必要がでてくる。 確率問題の解き方をバッチリ忘れていたのショック。
2020-04-15 10:41:23ラジオ体操 第一 第二 首の体操 youtu.be/3V4d7N5SyvI @YouTubeより なんだかんだこの動画が最強ですわ…。デスク作業の合間にやると血流が回復するので疲労感が出づらい。
2020-04-15 11:11:56@trappybunny 久しぶりの試験勉強なのですが意外に面白いな!?ってなってます。あとTwitterが学習メモとして優秀(個人差があります)
2020-04-15 19:04:22フルタイム休業の間になにかやることないとやべーなと思って資格の勉強とかするの、たぶん禁固刑の受刑者が刑務作業やりたがる理由と同じだと思う。
2020-04-15 19:15:47質的変数は名義尺度・順序尺度に分かれる。順序尺度は通知表の成績のように順序関係があるもの、名義尺度は性別のように順序がないもの。 量的変数は間隔尺度と比例尺度に分かれる。(間隔尺度と比例尺度は理解し切れていない)
2020-04-16 09:19:595数要約:分布の形状を把握するためのセット。最小値、第1四分位数、中央値、第3四分位数、最大値 5数要約ってなんかかっこよくない?西尾維新とかに出てきそう
2020-04-16 10:25:14数列が出たぞー!!(狼が出たぞ的な叫び) 久しぶりにΣをみたわ。びっくりしてる顔文字でしかお目にかからんかったから。∑(゚Д゚)
2020-04-16 11:01:43偏差=観測値-平均値(偏差の総和は0) 平均偏差:偏差の絶対値の平均 分散:偏差の2乗の平均 標準偏差:分散の平方根(分散は2乗してるから単位が揃わなくなって扱いにくい)
2020-04-16 11:08:26偏差は各観測値がどれだけ平均から離れているかを示すので、それをまとめて一つの値にできればばらつきの指標にできる。しかし総和が0=平均も0になってしまうので、絶対値とったり2乗したりしてどうにか平均を取れるようにした。2乗したやつは扱いづらかったので平方根とって元に戻ったかんじに。
2020-04-16 11:13:51仮平均、手計算する時は便利だな。元の観測値群xをキリのいい数にできるy=a+bxを使ってyの平均を出し、公式でxの平均値を復元する。
2020-04-16 11:24:53標準化・基準化: 前提の異なるデータ間での比較を可能にするため、偏差を標準偏差で除した値を出すこと。 z値・zスコア:標準化で出した各値。z値の平均は0、標準偏差は1になる。 ※z値の平均と標準偏差については後で確認すること。
2020-04-16 11:44:49変動係数:標準偏差÷平均 単位や前提が異なるデータの散らばり具合を比較するための値。 標準化はある値が仮に正規分布にあったらどのあたり?を見るためのもので、変動係数は単位を各データの平均に揃えて散らばりを比較するもの、という理解でいいんだろうか。
2020-04-16 11:53:52章の途中だけど今日はおしまい!わからないところをすぐにスマホで調べて多角的に確認できるのは今の時代のめちゃくちゃいいところだな。昔だったら図書館しまってると詰み。
2020-04-16 11:55:16いま使ってるテキスト、各指標が生まれた因果関係をわりと書いてくれるので大変助かりますね。ハリハリは丸暗記苦手だけど理屈通れば理解できる。
2020-04-16 12:00:23共分散:2変数の偏差の積の平均。相関の強さを数値で表せる(グラフは作りようで騙される可能性)。正の相関なら正の値、負なら負の値になる 相関係数:共分散÷2変数の標準偏差の積。2変数を標準化した値の共分散でもある。共分散が変数の単位の影響を受けやすい弱点をつぶす。最小-1、最大1
2020-04-17 09:41:32回帰分析:相関関係がある2変数に因果関係があると想定して、片方の変数(説明変数)の値からもう片方(被説明変数、目的変数)の値を予測すること 相関の有無は2変数間の因果関係を問わないしxとyの入れ替えも無問題だが、回帰分析の場合はどっちが説明変数でどっちが目的変数かは重要
2020-04-17 10:12:22残差:観測値yi-予測値yi 残差平方和:残差の2乗の総和 回帰直線は残差平方和が最小になるような係数をとる。 回帰直線は各観測値にできるだけ近いところをとおる直線→(観測値-回帰直線の値)^2の総和が最も小さいものになればいい! 残差平方和から回帰係数を求めるには正規方程式とかいうのを使う
2020-04-17 10:29:55回帰分析は観測値の範囲から大きく外れている値の予測には使わない方がいい(外挿)。言われてみりゃあそうだ。めちゃくちゃ世の中で使われてる気がするけど。
2020-04-17 10:35:44