機械学習のライブラリなどを使おうとすると,データフレーム型からnumpyのarray型にしないと引数として渡せない場合があります.このデータフレームからarrayに変換する方法は色々あるんですが,一番簡単なのはas_matrix()を使うことでしょうか.
In [102]: import pandas as pd
In [103]: import numpy as np
In [104]: df = pd.DataFrame({'Time': ['10:00:00', '10:00:01', '10:00:02', '10:00:03', '10:00:04','10:00:05', '10:00:06', '10:00:07', '10:00:08', '10:00:09'],
...: 'Value1': [25, 30, 104, 52, 41, 91, 102, 40 ,101 ,97],
...: 'Value2': [45, 19, 34, 19, 78, 148, 45, 53 ,74 ,32]})
In [105]: df
Out[105]:
Time Value1 Value2
0 10:00:00 25 45
1 10:00:01 30 19
2 10:00:02 104 34
3 10:00:03 52 19
4 10:00:04 41 78
5 10:00:05 91 148
6 10:00:06 102 45
7 10:00:07 40 53
8 10:00:08 101 74
9 10:00:09 97 32
In [106]: array = df.as_matrix()
In [107]: array
Out[107]:
array([['10:00:00', 25, 45],
['10:00:01', 30, 19],
['10:00:02', 104, 34],
...,
['10:00:07', 40, 53],
['10:00:08', 101, 74],
['10:00:09', 97, 32]], dtype=object)
こんな感じ
2020/3/6追記
as_matrixはどうやら無くなるみたいですね.
FutureWarning: Method .as_matrix will be removed in a future version. Use .values instead.
とのこと.なので代わりに
df.values.tolist()
を使いますかな.