用于存储数据的csv文件有时候数据量是十分庞大的,然而我们有时候并不需要全部的数据,我们需要的可能仅仅是前面的几行。
这样就可以通过pandas中read_csv中指定行数读取的功能实现。
相关推荐:《Python入门教程》
例如有data.csv文件,文件的内容如下:
GreydeMac-mini:chapter06greyzhang$catdata.csv ,name_01,coment_01,,,, 2,name_02,coment_02,,,, 3,name_03,coment_03,,,, 4,name_04,coment_04,,,, 5,name_05,coment_05,,,, 6,name_06,coment_06,,,, 7,name_07,coment_07,,,, 8,name_08,coment_08,,,, 9,name_09,coment_09,,,, 10,name_10,coment_10,,,, 11,name_11,coment_11,,,, 12,name_12,coment_12,,,, 13,name_13,coment_13,,,, 14,name_14,coment_14,,,, 15,name_15,coment_15,,,, 16,name_16,coment_16,,,, 17,name_17,coment_17,,,, 18,name_18,coment_18,,,, 19,name_19,coment_19,,,, 20,name_20,coment_20,,,, 21,name_21,coment_21,,,,
如果我们需要的数据仅仅是前5行,那么读取方式可以通过nrows的方式进行指定。编写代码如下:
#!/usr/bin/python importpandasaspd data=pd.read_csv('data.csv',nrows=5) print(data)
代码的运行结果如下:
GreydeMac-mini:chapter06greyzhang$pythonrow_test.py Unnamed:0name_01coment_01Unnamed:3Unnamed:4Unnamed:5\ 02name_02coment_02NaNNaNNaN 13name_03coment_03NaNNaNNaN 24name_04coment_04NaNNaNNaN 35name_05coment_05NaNNaNNaN 46name_06coment_06NaNNaNNaN Unnamed:6 0NaN 1NaN 2NaN 3NaN 4NaN GreydeMac-mini:chapter06greyzhang$
从上面的结果中可以看出,通过指定读取行数实现了预期的功能。
上一篇