把多个文件打包压缩成tar.gz文件并解压的Java实现
压缩文件
??在Java中,可以 使用GZIPOutputStream
创建gzip(gz)压缩文件,它在commons-compress下面,可以通过如下的maven坐标引入:
org.apache.commons
commons-compress
1.21
tar.gz文件可以理解为通过如下方式获取的文件:先用tar打包,再使用gz进行压缩。下面直接上代码:
package com.eg.wiener.utils;
import lombok.extern.slf4j.Slf4j;
import org.apache.commons.compress.archivers.tar.TarArchiveEntry;
import org.apache.commons.compress.archivers.tar.TarArchiveOutputStream;
import org.apache.commons.compress.utils.IOUtils;
import org.apache.commons.lang3.RandomStringUtils;
import java.io.*;
import java.util.zip.GZIPOutputStream;
@Slf4j
public class FileUtils {
/**
*
* 压缩文件
*
* @param sourceFolder 指定打包的源目录
* @param tarGzPath 指定目标 tar 包的位置
*/
private static void compress(String sourceFolder, String tarGzPath) {
log.info("压缩后文件名:{}", tarGzPath);
TarArchiveOutputStream tarOs = null;
try {
// 创建一个 FileOutputStream 到输出文件(.tar.gz)
FileOutputStream fos = new FileOutputStream(tarGzPath);
// 创建一个 GZIPOutputStream,用来包装 FileOutputStream 对象
GZIPOutputStream gos = new GZIPOutputStream(new BufferedOutputStream(fos));
// 创建一个 TarArchiveOutputStream,用来包装 GZIPOutputStream 对象
tarOs = new TarArchiveOutputStream(gos);
// 使文件名支持超过 100 个字节
tarOs.setLongFileMode(TarArchiveOutputStream.LONGFILE_POSIX);
File sourceFile = new File(sourceFolder);
//遍历源目录的文件,将所有文件迁移到新的目录tarGzPath下
File[] sources = sourceFile.listFiles();
for (File oneFile : sources) {
addFilesToTarGZ(oneFile.getPath(), "", tarOs);
}
} catch (IOException e) {
log.error("压缩失败,", e);
} finally {
try {
tarOs.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
/**
* @param sourcePath 源文件
* @param parent 源目录
* @param tarArchive 压缩输出流
* @throws IOException
*/
public static void addFilesToTarGZ(String sourcePath, String parent, TarArchiveOutputStream tarArchive) throws IOException {
File sourceFile = new File(sourcePath);
// 获取新目录下的文件名称
String fileName = parent.concat(sourceFile.getName());
//打包压缩该文件
tarArchive.putArchiveEntry(new TarArchiveEntry(sourceFile, fileName));
if (sourceFile.isFile()) {
FileInputStream fis = new FileInputStream(sourceFile);
BufferedInputStream bis = new BufferedInputStream(fis);
// 写入文件
IOUtils.copy(bis, tarArchive);
tarArchive.closeArchiveEntry();
bis.close();
} else if (sourceFile.isDirectory()) {
// 因为是个文件夹,无需写入内容,关闭即可
tarArchive.closeArchiveEntry();
// 遍历文件夹下的文件
for (File f : sourceFile.listFiles()) {
// 递归遍历文件目录树
addFilesToTarGZ(f.getAbsolutePath(), fileName + File.separator, tarArchive);
}
}
}
}
解压文件
??解压文件时依赖的jar包如下:
org.apache.ant
ant
1.10.5
??压缩文件时遇到了繁琐的关闭资源的问题,故这里优先考虑使用try-with-resources,而不是try-finally。由此带来的好处是使代码更简洁、更清晰,即便是抛出的异常,也更有价值,这些优点是try-finally无法做到的。
/**
* 解压tar.gz 文件
* @param targzFile 要解压的tar.gz文件对象
* @param outPath 要解压到某个指定的目录下
* @throws IOException
*/
public static void unpack(File targzFile, String outPath) {
// 验证参数
if (targzFile == null || !targzFile.isFile() || StringUtils.isEmpty(outPath)) {
log.error("文件解压缩执行异常,请检查输入参数!");
return;
}
// 读取 .tar.gz 文件转换为 tar 文件
try (FileInputStream is = new FileInputStream(targzFile);
BufferedInputStream bis = new BufferedInputStream(is);
GZIPInputStream gzipIs = new GZIPInputStream(bis);
TarInputStream tarIs = new TarInputStream(gzipIs, 1024 * 2)) {
// 迭代 tar 文件集合,解压文件
for (TarEntry entry = tarIs.getNextEntry(); entry != null; entry = tarIs.getNextEntry()) {
File targetFileName = new File(outPath + "/" + entry.getName());
IOUtils.copy(tarIs, new FileOutputStream(targetFileName));
}
log.info("文件 {} 解压完毕", targzFile);
} catch (Exception e) {
log.error("{} 解压异常!", targzFile, e);
}
}
??测试用例就放在一个main函数里了,如下所示:
public static void main(String[] args) throws IOException {
// 把F:\img\source内的文件及其文件夹打包成名为文件夹F:\img\target下的、名字为六位随机数的 gz 压缩包
String targetPath = "F:\\img\\target\\" + RandomStringUtils.randomAlphanumeric(6) + ".tar.gz";
compress("F:\\img\\source", targetPath);
log.info("=====done====");
unpack(new File(targetPath) , "F:\\img\\unpack");
}
小结
??小编楼兰胡杨在此介绍了如何把多个文件压缩成gz文件,并实现解压。如果你有更好的方案,请留言。