链家2018秋招客户端大数据工程师,今年比较热门的岗位


在牛客网上做了很多题,求职时也确实用到了很多在这个平台上学到的知识,下面的这个是去年链家客户端的笔试试题,有这方面意向的可以做一下,希望可以帮到大家

一、选择题

1、正则表达式”*””?”的含义分别是?(D

A 匹配前一个子表示1次或多次,匹配前一个子表达式0次或多次

B 匹配前一个字表达式0次或多次,匹配前一个子表达式1次或多次

C 匹配前一个字表达式1次或多次,匹配前一个子表达式0次或1

D匹配前一个子表达式0次或多次,匹配前一个子表达式0次或1

2、某超市研究销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?A

A 关联规则发现

B 聚类

C 分类

D 自然语言处理

3、javaNIOselector的作用是(B

A 选择ByteBuffer的数据

B 用来处理多个ChannelOperation

C 用来处理多个ByteBuffer的数据

D 用来在Channel间传递数据

4、下面那些不是数据仓库中存的数据类型?C

A 星型模型

B 雪花模型

C 分子模型

D 星座模型

5、数据仓库Hive可以使用下列哪些技术作为查询引擎B

A storm

B mapreduce

C fllnk

D Tez

6、大数据应用需依托的新技术有(D

A 大规模存储与计算

B 数据分析处理

C 智能化

D 三个选项都是

7、跳跃表(SkipList)的底层数据结构是B

A 大顶堆

B 链表

C 红黑树

D 双端队列

8、大数据的核心就是B

A 告知与许可

B 预测

C 匿名化

D 规模化

9、HDFS不擅长存储大量小文件,最主要的原因是(A

A会占用NameNode太多内存

B 会占用NameNode太多硬盘

C 会占用DataNode太多内存

D 会占用DataNode太多硬盘

10、相比依赖于小数据和精确性的时代,大数据因为更强调数据的()帮助我们进一步接近事实的真相。D

A 安全性

B 完整性

C 混杂性

D 完整性和混杂性

11Kafka常被用于采集数据的传输,下列关于Kafka的说法,哪些是正确的?D

A Kafka的元数据存在于单独的MAster的节点上

B Kafka中,topicpartion数量不能超过broker的数量

C Kafka中,topicreplication数量不能超过broker数量

D Kafka中,consumer group中的consumer数量不应该多于要消费得topicpartition的数量。

12、下列安歇情况属于适合MapReduce的应用场景AD

A 海量数据的定时ETL

B 海量数据的定时告警

C 对数据仓库进行交互式查询分析

D 对数据仓库进行离线分析

13、下面哪一项不属于大数据关键技术?D

A 云计算

B 分布式文件系统

C 数据众包

D 关系型数据库

14、假设现在要开发一套做服务日志的采集系统,以下哪种技术不适合做日志采集工具D

A Flume

B Scribe

C Logstach

D Sqoop

15、Hicve可以使用哪种数据库存储元数据?C

A MysSqlHBase

B DerbyRedis

C DerbyMySql

D RedisMySql

16、大数据是指不用随机分析这样的捷径,而采用(A)的方法

A 所有数据

B 绝大部分数据

C 适量数据

D 少量数据

17、Spark中,调用persise()方法对RDD进行持久化,下列哪一项不是合法的持久化级别?(B

A MEMORY_ONLY

B MEMEORY_SER

C DISK_ONLY

D MEMORY_AND_DISK_SER

18、下面陈述不正确的是(C

A 大数据将实现科学决策

B 大数据使***决策更加精准化

C 大数据彻底将***化解在萌芽状态

D 大数据将实现预测式决策

19、Spark中,下列哪种操作不会引发数据混选(shuffle)?(B

A reduceByKey

B mapValues

C groupByKey

D repartition

20、以下哪种技术组合不适用于构建实时计算系统D

A Kafka +Flink

B Kafka +Storm

C HBase+Spark Streaming

D HDFS+MapReduce

二、编程题

1、试题描述:

玥玥带乔乔一起逃亡,现在有许多的东西要放到乔乔的包里面。但是包的大小有限,所以我们只能够在里面放入非常重要的物品,现在给出该物种的数量,体积,价值的数值,希望你能够算出怎样能使背包的价值最大的组合方式,并且算出这个数值,乔乔会非常感谢你

对于30%的数据1<=v<=500 1<=n<=2000 1<=m<=10

1<=w<=20 1<=s<=100

输入

1行有2个整数,物品种树n和背包装载体积v

2行到+1行每行3个整数,为第i种物品的数量m,体积w,价值s

输出

仅包含一个整数,即为能拿到的最大的物品价值总和。

样列说明:选第一种一个,第二种两个,结果为3*1+5*2=13.

输入示例:

2 10

3 4 3

2 2 5

输出示例

13

2、试题描述:

要把m升的水倒入n个相同的容器中(假设容器足够大),允许有的容器是空的,问共有多少种不同的倒法?(用k表示)5,1,115,11,1,5是同一种倒法

输入

第一行是测试数据的数目x0<=x<=20.以下每行均包含二个整数mn,以空格分开,1<=m,n<=10

输出

对输入的每行数据mn,用一行输出相应的k

输入示例:

1

7 3

输出示例:

8

3、试题描述:

小明有n1<=n<=2000)个美味的食物,他想要卖掉它们来赚钱,这些食物放在一些箱子里,它们有些有趣的特性:

(1)这些食物被编号为1-n,每一天小明可以从这排箱子的头部或者尾部取出食物去卖;

(2)这些食物放的越久,年龄越大。价值越大,食物i有一个初始的价值V(I);

(3)放了a天后,年龄为a,食物最终的价值为Vi*a.

给定每一个食物的初始价值v(i),请求出小明卖掉它们后可以获得的最大价值,第一天出售的食物的年龄为1,此后每增加一天食物的年龄就增加1.

提示

样例说明:小明出售这些食物(初始价值1,3,1,5,2)的顺序为:第一天卖掉第1个,第二天卖掉第5个,第三天卖掉第2个,第四天卖掉第3个,第5天卖掉第4个,获得最大的价值

1*1+2*2+3*3+4*1+5*5=43.

输入

1L一个整数n

i+1行:每行为食物i的初始价值Vi

输出

1行:小明最终可以获得的最大价值。

输入示例:

5

1

3

1

5

2

输出

45

#秋招##大数据开发工程师##笔试题目##链家网#
全部评论

相关推荐

点赞 26 评论
分享
牛客网
牛客企业服务