Pandas

Pythonライブラリに関するチートシート

以前からプログラミング作業効率化のために、Pythonでよく使うライブラリについてまとめていました。 publicjournal.hatenablog.com publicjournal.hatenablog.com最近、チートシートがTwitterで流れてきたので、リンクを貼っておきます。 チートシートリン…

Pythonでよく使うコード:その1

忘れて何度も引き直すのでメモ.都度更新予定. Pythonの基礎的な操作 リスト内包表記 コマンドライン引数 ファイル獲得(glob) print文関係 その他テクニック 下記に描画編を作りました。 publicjournal.hatenablog.com publicjournal.hatenablog.com Pyth…

データフレームの各行の差を計算してグラフ化する:Pandas

やりたいことしては,タイトル通り『データフレームの各行の差を計算してグラフ化する』ことです.Pandasのデータフレームを用いて各列の時間差を計算してグラフに出力するということをやります.今回はTimedelta型を使っているのですが,データフレームの差…

Pandasデータフレーム内の複数の文字を「.str.split」を使って区切る

Pandas(@Python)のデータフレーム内のstringを複数の文字で区切りたい場合があります. 「.str.split」を使うのですが少し工夫が必要です. まぁ,簡単に言うと縦棒「|」で区切るわけですよ. import pandas as pd df = pd.DataFrame( {'Time': ['jt=10:00:…

CSVファイルが読み込めない

症状 Spyderを使っていてCSVファイルが読み込めなくなる File b'ファイル名.csv' does not exist 原因 Spyderの設定でワークスペースを変えるとこうなる 対処 パスを通せば良い path = '++++\名前\' df = pd.read_csv(path + "dataset.csv",header = None) …

データの集約とグループ演算をやってみる Pandas

PythonのPandasを使っていると,例えば同じ名前の者同士を一括りにして,平均なり最大値を出したり,という処理を迫られることがあります.私自身,この間それを迫られた訳で,オライリーの本を読んで,どういう挙動を示すか色々試してみました.せっかくな…

Python3:CSVファイルの入出力について色々

Pandasを用いたCSVファイルの入出力について色々試してみました.下の英語ドキュメントに詳しく書いてあるんですが,自分がよく使うものだけピックアップしてメモしておきます. pandas.read_csv — pandas 0.19.2 documentation テスト用にこんなCSVファイル…

ix,loc,ilocによるデータフレームのアクセス:Pandas

ix,loc,ilocは何が違うのか?こいつらを使ってスクリプトを書いたのですが,やや気づきにくい不具合があり,苦戦しました.そんなときに下記のブログに参考にして直しましたが,自分でも試行錯誤したので,その一部を記録しておきます. Python pandas デー…

Python3.X:データフレームの生成方法色々

その1 数字だけ入れると勝手にHeaderとIndexが追加される In [17]: import pandas as pd In [18]: df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) In [19]: df Out[19]: 0 1 2 0 1 2 3 1 4 5 6 2 7 8 9 その2 HeaderとIndexを自分で指定する In [2…