机器学习特训营课件之mapreduce

1、第二次课的第23张PPT说“Mapper会将它们按照key值进行排序”,那么是按照首字母对应的数值从小到大排还是所有字母的数值之和从小到大排?
2、 第24张PPT,排序结果中,“Bye”和“Hello”的list为什么是(1,1)而"Hadoop"和“Word”的list是(2)?其实这四个单词都出现了2次 
全部评论
1.排序需要实现 WritableComparable 接口,因此你去看一下mapper的key类里是怎么实现 WritableComparable接口的? 2.这个可以看一下 org.apache.hadoop.mapreduce.Reducer类的 protected void reduce(KEYIN key, Iterable<VALUEIN> values, Reducer<KEYIN, VALUEIN, KEYOUT, VALUEOUT>.Context context) 可以看到传入reduce的value是Iterable的, 至于为什么“ Bye”和“Hello”的list为什么是(1,1)而"Hadoop"和“Word”的list是(2) ”,是因为Hadoop和word只在1个mapper里出现过了,而bye和hello两个mapper里都出现了
点赞 回复 分享
发布于 2015-12-09 14:47

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务