MapReduce输入格式
一:输入格式
概念:输入格式是指源文件输入到Mapper中的格式。
二:默认输入格式:TextInputFormat
继承FileInputFormat
源文件一行行输入到Mapper,Key是文件的偏移量,Value是行字符串。
三:自定义输出格式
3.1新建输出格式类
继承FileInputFormat
重写createRecordReader方法,在该方法中实现输出格式的定义
四:常用输出格式1.