Client端小文件合并的思路是现将小文件合并到大文件中,再把合并的大文件提交给MapReduce程序
理想的Client端小文件合并结果是,每一个上传的文件大小都要尽量的大越大越好
实现Client端小文件合并,需要实现一个BucketThread类,将小文件合并成HDFS块大小
BucketThread类是实现Runable接口的独立线程,通过提供copyMerge()方法,把小文件合并为一个大文件
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题