numpy数组之存取文件的实现示例

脚本专栏 2025/10/18 佚名

3 2 1

幽灵资源网 Design By www.bzswh.com

将 numpy 数组存入文件，有多种文件类型可供选择，对应地就有不同的方法来读写。

下面我将介绍读写 numpy 的三类文件：

txt 或者 csv 文件
npy 或者 npz 文件
hdf5 文件

通过 numpy 读写 txt 或 csv 文件

import numpy as np

a = np.array(range(20)).reshape((4, 5))
print(a)

# 后缀改为 .txt 一样
filename = 'data/a.csv'
# 写文件
np.savetxt(filename, a, fmt='%d', delimiter=',')

# 读文件
b = np.loadtxt(filename, dtype=np.int32, delimiter=',')
print(b)

缺点：

只能保存一维和二维 numpy 数组，当 numpy 数组 a 有多维时，需要将其 a.reshape((a.shape[0], -1)) 后才能用这种方式保存。
不能追加保存，即每次 np.savetxt() 都会覆盖之前的内容。

通过 numpy 读写 npy 或 npz 文件

读写 npy 文件

import numpy as np

a = np.array(range(20)).reshape((2, 2, 5))
print(a)

filename = 'data/a.npy'
# 写文件
np.save(filename, a)

# 读文件
b = np.load(filename)
print(b)
print(b.shape)

优点：

npy 文件可以保存任意维度的 numpy 数组，不限于一维和二维；
npy 保存了 numpy 数组的结构，保存的时候是什么 shape 和 dtype，取出来时就是什么样的 shape 和 dtype。

缺点：

只能保存一个 numpy 数组，每次保存会覆盖掉之前文件中存在的内容（如果有的话）。

读写 npz 文件

import numpy as np

a = np.array(range(20)).reshape((2, 2, 5))
b = np.array(range(20, 44)).reshape(2, 3 ,4)
print('a:\n', a)
print('b:\n', b)

filename = 'data/a.npz'
# 写文件， 如果不指定key，那么默认key为'arr_0'、'arr_1'，一直排下去。
np.savez(filename, a, b=b)

# 读文件
c = np.load(filename)
print('keys of NpzFile c:\n', c.keys())
print("c['arr_0']:\n", c['arr_0'])
print("c['b']:\n", c['b'])

优点：

npy 文件可以保存任意维度的 numpy 数组，不限于一维和二维；
npy 保存了 numpy 数组的结构，保存的时候是什么 shape 和 dtype，取出来时就是什么样的 shape 和 dtype；
可以同时保存多个 numpy 数组；
可以指定保存 numpy 数组的 key，读取的时候很方便，不会混乱。

缺点：

保存多个 numpy 数组时，只能同时保存，即 np.savez(filename, a, b=b) 。每次保存会覆盖掉之前文件中存在的内容（如果有的话）。

通过 h5py 读写 hdf5 文件

优点：

不限 numpy 数组维度，可以保持 numpy 数组结构和数据类型；
适合 numpy 数组很大的情况，文件占用空间小；
可以通过 key 来访问 dataset（可以理解为 numpy.array），读取的时候很方便，不会混乱。
可以不覆盖原文件中含有的内容。

简单读取

import numpy as np
import h5py

a = np.array(range(20)).reshape((2, 2, 5))
b = np.array(range(20)).reshape((1, 4, 5))
print(a)
print(b)

filename = 'data/data.h5'
# 写文件
h5f = h5py.File(filename, 'w')
h5f.create_dataset('a', data=a)
h5f.create_dataset('b', data=b)
h5f.close()

# 读文件
h5f = h5py.File(filename, 'r')
print(type(h5f))
# 通过切片得到numpy数组
print(h5f['a'][:])
print(h5f['b'][:])
h5f.close()

通过切片赋值

import numpy as np
import h5py

a = np.array(range(20)).reshape((2, 2, 5))
print(a)

filename = 'data/a.h5'
# 写文件
h5f = h5py.File(filename, 'w')
# 当数组a太大，需要切片进行操作时，可以不直接对h5f['a']进行初始化；
# 当之后不需要改变h5f['a']的shape时，可以省略maxshape参数
h5f.create_dataset('a', shape=(2, 2, 5), maxshape=(None, 2, 5), dtype=np.int32, compression='gzip')
for i in range(2):
  # 采用切片的形式赋值
  h5f['a'][i] = a[i]
h5f.close()

# 读文件
h5f = h5py.File(filename, 'r')
print(type(h5f))
print(h5f['a'])
# 通过切片得到numpy数组
print(h5f['a'][:])

同一个 hdf5 文件可以创建多个 dataset，读取的时候按照 key 来即可。

总结

csv 和 txt 只能用来存一维或二维 numpy 数组；
npy 用来存单个 numpy 数组，npz 可以同时存多个 numpy 数组，两者都不限 numpy 维度，且都保持 numpy 数组的 shape 和 dtype，写文件时若原文件存在只能覆盖原文件内容；
当 numpy 数组很大时，最好使用 hdf5 文件，hdf5 文件相对更小；
当 numpy 数组很大时，对整个 numpy 数组进行运算容易发生 MemoryError，那么此时可以选择对 numpy 数组切片，将运算后的数组保存到 hdf5 文件中，hdf5 文件支持切片索引。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

numpy数组存取文件

标签：

numpy数组存取文件

幽灵资源网 Design By www.bzswh.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

幽灵资源网 Design By www.bzswh.com

评论“numpy数组之存取文件的实现示例”

暂无评论...

www.bzswh.com 幽灵资源网

143,552互联网资源

29,117高清电影

46,608技术教程

224,608站长资源

最新文章

群星《奔赴！万人现场第2期》[FLAC/分轨][5

2025/10/18

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》

2025/10/18

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》

2025/10/18

【古典音乐】詹姆斯·高威《季节》1993[WAV+

2025/10/18

贝拉芳蒂《卡里普索之王》SACD[WAV+CUE]

2025/10/18

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2025/10/18

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

numpy数组之存取文件的实现示例

numpy数组存取文件

numpy linalg模块的具体使用方法

python flask解析json数据不完整的解决方法

评论“numpy数组之存取文件的实现示例”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

友情链接

numpy数组之存取文件的实现示例

numpy数组存取文件

numpy linalg模块的具体使用方法

python flask解析json数据不完整的解决方法

评论“numpy数组之存取文件的实现示例”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存