免费个人网站申请,网站备案怎么弄,网站维护的主要工作,国内个人网站搭建1 Pre-knowledge .tar.gz 文件是一种常见的压缩文件格式#xff0c;它实际上是两种压缩格式的组合#xff1a;.tar 和 .gz。
.tar#xff1a;这是“tape archive”的缩写#xff0c;是一种打包#xff08;archiving#xff09;文件格式#xff0c;用于将多个文件和目录…1 Pre-knowledge .tar.gz 文件是一种常见的压缩文件格式它实际上是两种压缩格式的组合.tar 和 .gz。
.tar这是“tape archive”的缩写是一种打包archiving文件格式用于将多个文件和目录合并成一个单一的文件以便存储或传输。.tar 文件本身并不压缩数据它只是将文件和目录打包在一起。.gz这是“gzip”的缩写是一种压缩程序使用LZ77算法对文件进行压缩。.gz 文件是gzip压缩程序压缩过的文件。 当一个文件被压缩为 .tar.gz 或 .tgz 格式时意味着该文件首先被打包成一个 .tar 文件然后这个 .tar 文件被gzip程序进一步压缩。这样做的好处是可以先打包多个文件再进行压缩使得文件传输和存储更加高效。
2 OC22 Download 我们使用到的数据集为OC22中的IS2RS/IS2RE。点击html中的蓝色链接即可下载原始数据。 html link:https://fair-chem.github.io/core/datasets/oc22.html
3 Code
import tarfile# 指定解压缩的文件名
in_path data/is2res_total_train_val_test_lmdbs.tar.gz# 打开.tar.gz文件
tar tarfile.open(in_path, r:gz)# 列出压缩包中的文件
for member in tar.getmembers():print(member.name)# 提取压缩包中的文件
tar.extractall()# 关闭tar文件
tar.close()
首先使用tarfile.open()函数打开.tar.gz文件参数”r:gz”指定了以读取、gzip压缩的模式打开文件。然后使用tar.getmembers()函数列出压缩包中的文件并逐个打印文件名。最后使用tar.extractall()函数提取压缩包中的所有文件到当前目录tar.close()函数关闭tar文件。
4 Result 输出压缩包中的文件名为 在使用tar.extractall()函数后将数据解压缩到了文件名称所对应的目录。