7.30一面: 1.自我介绍,聊了一会儿项目 2.介绍一下MR的shuffle机制 3.编程题: 有一文件a.txt 文件内容为每行由字符串数字用逗号分隔, 例: abc,1 abc,3 lsl,9 ash,10 flu,11 … 现在要求实现一个单机程序,统计出这个文件中相同字符串出现的次数和对应数字的总和 用java统计词频问题,,我用了HashMap来统计 4.场景设计,还是刚才那道题,如果有文件中一亿条数据,怎么办? 我回答考虑多线程,还是用Map,但是不能用HashMap,需要用多个ConcurrentHashMap, 使...