1500字范文,内容丰富有趣,写作好帮手!
1500字范文 > pandas读取⽂件的read_csv()⽅法的parse_dates参数

pandas读取⽂件的read_csv()⽅法的parse_dates参数

时间:2020-10-24 07:23:01

相关推荐

pandas读取⽂件的read_csv()⽅法的parse_dates参数

转自百度文库

parse_dates参数:

将csv中的时间字符串转换成⽇期格式

TestTime.csv⽂件:

"name","time","date"

'Bob',21:33:30,-10-10

'Jerry',21:30:15,-10-10

'Tom',21:25:30,-10-10

'Vince',21:20:10,-10-10

'Hank',21:40:15,-10-10

import pandas as pd

(1)、

df=pd.read_csv('./TestTime.csv',parse_dates=[['time','date']])

print(df)

"""

指定parse_dates = [ ['time', 'date'] ],即将[ ['time', 'date'] ]两列的字符串先合并后解析⽅可。合并后的新列会以下划线'_'连接原列名命名

本例中解析后的命名为:time_date,解析得到的⽇期格式列会作为DataFrame的第⼀列。

在index_col指定表格中的第⼏列作为Index时需要⼩⼼。如本例中,指定参数index_col=0,

则此时会以新⽣成的time_date列⽽不是name作为Index。因此保险的⽅法是指定列名,如index_col = 'name'

结果:

time_date name

0 -10-10 21:33:30 'Bob'

1 -10-10 21:30:15 'Jerry'

2 -10-10 21:25:30 'Tom'

3 -10-10 21:20:10 'Vince'

4 -10-10 21:40:1

5 'Hank'

"""

(2)、

df=pd.read_csv('./TestTime.csv',parse_dates=['time','date'])

print(df)

"""

如果写成了parse_dates=['time', 'date'] ,pd.read_csv()会分别对'time', 'date'进⾏字符串转⽇期,此外还会造成⼀个⼩⼩的⿇烦。

由于本例中的Time时间列格式为'HH:MM:SS',

parse_dates默认调⽤dateutil.parser.parse解析为Datetime格式,在解析time这⼀列时,会⾃作主张在前⾯加上⼀个当前⽇期。

结果:

name time date

0 'Bob' -10-17 21:33:30 -10-10

1 'Jerry' -10-17 21:30:15 -10-10

2 'Tom' -10-17 21:25:30 -10-10

3 'Vince' -10-17 21:20:10 -10-10

4 'Hank' -10-17 21:40:1

5 -10-10

"""

【注】:read_csv()⽅法指定parse_dates会使得读取csv⽂件的时间⼤⼤增加

(3)、

df=pd.read_csv('./TestTime.csv',parse_dates=[['time','date']],infer_datetime_format=True)

print(df)

"""

infer_datetime_format=True可显著减少read_csv命令⽇期解析时间

"""

(4)、

df=pd.read_csv('./TestTime.csv',parse_dates=[['time','date']],infer_datetime_format=True,keep_date_col=True)

print(df)

"""

keep_date_col=True/False参数则是⽤来指定解析为⽇期格式的列是否保留下来,True保留,False不保留

本例中=True即原解析的列time和date被保留下来

结果:

time_date name time date

0 -10-10 21:33:30 'Bob' 21:33:30 -10-10

1 -10-10 21:30:15 'Jerry' 21:30:15 -10-10

2 -10-10 21:25:30 'Tom' 21:25:30 -10-10

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。