2018-01-01から1年間の記事一覧

標準化と中心化

Pythonで標準化とか中心化はどうやってやるんだろうという話です.結論だけ書きます.(そのうち合間を見て加筆します)このページではこういうデータを使います 標準化 from scipy import stats x = df.iloc[:, 2:6].apply(stats.zscore, axis=0) x.head() …

バイアス-バリアンス分解の導出を真面目にやる

どうもです.只今,下記の書籍にを用いて勉強中です.応用をめざす 数理統計学 (統計解析スタンダード)作者: 国友直人出版社/メーカー: 朝倉書店発売日: 2015/08/25メディア: 単行本(ソフトカバー)この商品を含むブログを見るP118のあたりに推定の偏りの話…

Windows環境下でPython版のglmnetを使うとどうなるか?

夏のある日のこと, 私はLasso回帰を用いてあるデータを分析しようとしていた.glmnetを呼び出して実行したところ, x input must be a scipy float64 ndarray とエラーメッセージが帰ってきた.あれ?っと思ったけど,その日に扱っていたのは整数値だったこ…

StatsModelsとscikit-learnのElastic Net(Lasso回帰)を比較してみた

最近スパース推定の勉強会に参加しております.使っているテキストはこちら.スパース推定法による統計モデリング (統計学One Point)作者: 川野秀一,松井秀俊,廣瀬慧出版社/メーカー: 共立出版発売日: 2018/03/08メディア: 単行本この商品を含むブログを見る…

データフレームの各行の差を計算してグラフ化する:Pandas

やりたいことしては,タイトル通り『データフレームの各行の差を計算してグラフ化する』ことです.Pandasのデータフレームを用いて各列の時間差を計算してグラフに出力するということをやります.今回はTimedelta型を使っているのですが,データフレームの差…

Pandasデータフレーム内の複数の文字を「.str.split」を使って区切る

Pandas(@Python)のデータフレーム内のstringを複数の文字で区切りたい場合があります. 「.str.split」を使うのですが少し工夫が必要です. まぁ,簡単に言うと縦棒「|」で区切るわけですよ. import pandas as pd df = pd.DataFrame( {'Time': ['jt=10:00:…

ベイズ更新をやってみた!

3月の末にベイズ推定の勉強会に参加してきました! math-unknown.connpass.com この勉強会では単に講師の話を聞くだけではなく,みんなでワイワイディスカッションしながら進めるような形式で,グループ内の誰かが疑問に思ったことを後で調べることでより理…

ATOMをCドライブ以外にインストールする方法

ATOMってエディタがあって,これはでは「こいつはCドライブ以外にインストールできないのか?」と思っていましたが,ひょんなことからDドライブとかにもインストールできました. ある時ATOMを再インストールしようとすると「Installation has failed」と表…

PandasとStatsModelsを使って重回帰分析をしてみた

Pythonで重回帰分析をやってみました多変量解析法入門 (ライブラリ新数学大系)作者: 永田靖,棟近雅彦出版社/メーカー: サイエンス社発売日: 2001/04/01メディア: 単行本購入: 2人 クリック: 9回この商品を含むブログ (1件) を見るこの文献のP43~86を参考を…

PyCharm:interpolaterの設定にまつわるエラー

年末年始にかけてPyCharmをインストールし直したら,エラーが出まくりました・・・ 自分が勉強不足のところもあるわけですが,直すのに時間が掛かりました. 色々試行錯誤したのでメモっておきます. ちなみにインストールしているバージョンは「Anaconda3-5…