扣丁学堂Python培训简述pandas写入读取h5文件的方法

ITxuexi_66 · · 1154 次点击 · 开始浏览置顶

这是一个创建于的主题，其中的信息可能已经有所发展或是发生改变。

本篇文章扣丁学堂Python培训小编给大家分享一篇对pandas写入读取h5文件的方法详解，文中有代码列出供读者们参考，小编觉得有不错的参考价值，希望对大家有所帮助。 1、前言 hdf5在存储的是支持压缩，使用的方式是blosc，这个是速度最快的也是pandas默认支持的。使用压缩可以提磁盘利用率，节省空间。开启压缩也没有什么劣势，只会慢一点点。压缩在小数据量的时候优势不明显，数据量大了才有优势。同时发现hdf读取文件的时候只能是一次写，写的时候可以append，可以put，但是写完成了之后关闭文件，就不能再写了，会覆盖。 2、写入文件使用函数：pd.HDFStore import numpy as np import pandas as pd ####生成9000,0000条数据，9千万条 a = np.random.standard_normal((90000000,4)) b = pd.DataFrame(a) ####普通格式存储： h5 = pd.HDFStore('/data/stock/test_s.h5','w') h5['data'] = b h5.close() ####压缩格式存储 h5 = pd.HDFStore('/data/stock/test_c4.h5','w', complevel=4, complib='blosc') h5['data'] = b h5.close() 3、读取文件使用函数：pd.read_hdf 参数：文件名，key data=pd.read_hdf('/data/stock/test_c4.h5',key='data') 最后想要了解更多关于Python和人工智能方面内容的小伙伴，请关注扣丁学堂Python培训官网、微信等平台，扣丁学堂IT职业在线学习教育平台为您提供权威的Python开发环境搭建视频，Python培训后的前景无限，行业薪资和未来的发展会越来越好的，扣丁学堂老师精心推出的Python视频教程定能让你快速掌握Python从入门到精通开发实战技能。扣丁学堂Python技术交流群：279521237。

有疑问加站长微信联系（非本文作者）