0729 字节跳动提前批三面面经

时长:1小时
体验:问的都是我意想不到的问题,问八股很少

  1. 介绍项目
  2. 问项目细节、写项目实现的伪代码(人傻了,随便写了点)
  3. 场景题:用户反应头条新闻刷不出来怎么排查问题?要从客户端角度考虑
  4. 代码到可执行文件的过程?(唯一八股)追问词法分析语法分析语义分析具体做了什么?
  5. 算法题:应该是部门自己出的,大概意思是:西瓜视频想找到高频词是哪些,给了一些敏感词需要过滤。输入:unordered_map<string,int>表示词汇、频率,set<string>表示敏感词,int k表示前k个高频词,返回vector<string>前k个高频词(不含敏感词)。主要考察排序+topK+unordered_map+set的使用吧,面试官要求尽量时间复杂度低。sort自定义排序不行,可能就想让自己写排序吧(优化快排或者堆排),没全写出来,写了80%吧
----0803更新,自己用堆排序写了一份代码,如果有问题请指出----
// 西瓜视频高频词.cpp : 定义控制台应用程序的入口点。
//

#include "stdafx.h"
#include<vector>
#include<iostream>
#include<unordered_map>
#include<string>
#include<unordered_set>
using namespace std;

void adjustHeap(vector<pair<string, int>>& arr, int begin, int end){
	int dad = begin, son = 2 * dad + 1;
	while (son <= end){
		if (son + 1 <= end&&arr[son].second > arr[son + 1].second) son++;
		if (arr[dad].second < arr[son].second) return;
		else{
			swap(arr[dad], arr[son]);
			dad = son;
			son = 2 * dad + 1;
		}
	}
}

void buildHeap(vector<pair<string, int>>& arr){ //建立小顶堆
	int len = arr.size();
	for (int i = len / 2 - 1; i >= 0; i--){
		adjustHeap(arr, i, len - 1);
	}
}


vector<string> getHotWords(unordered_map<string, int> mp, unordered_set<string>& st, int k){
	vector<pair<string, int>> heap(k); //维护小顶堆,每个节点为<词汇,频率>
	vector<string> res;
	int i = 0;
	bool hasBuild = false;

	for (auto p : mp){
		string curWord = p.first; //词汇
		int count = p.second; //词频
		if (i < k){ //加入小堆顶,先加入k个,建堆
			if (st.find(curWord) == st.end()){ //如果不是敏感词
				heap[i] = { curWord, count };
				i++;
			}
		}
		else{
			if (hasBuild==false){
				buildHeap(heap);
				hasBuild = true;
			}
			else{
				if (count > heap[0].second&&st.find(curWord)==st.end()){
					heap[0] = { curWord, count };
					adjustHeap(heap, 0, heap.size() - 1);
				}
			}
		}	
	}
	for (int i = 0; i < heap.size(); i++){
		res.push_back(heap[i].first);
		//cout << res[i] << endl;
	}
	return res;
}



int _tmain(int argc, _TCHAR* argv[])
{
	unordered_map<string, int> words{ 
	{ "易烊千玺", 10000 },
	{ "杨迪", 5000 },
	{ "李晓峰", 23 },
	{ "张三", 123 },
	{ "李四", 1 },
	{ "王源", 90000 },
	{ "宋亚轩", 200000 },
	{ "刘亦菲", 300 }
};
	unordered_set<string> st;
	st.insert("易烊千玺");
	st.insert("宋亚轩");

	int k = 1;
	cout << "前" << k << "个高频词为: " << endl;
	vector<string> ret=getHotWords(words, st, k);	
	for (int i = 0; i < ret.size(); i++){ //输出高频词
		cout << ret[i] << endl;
	}
	return 0;
}



  • 反问

嗯已凉,但是人品还是要攒的
#字节跳动##面经#
全部评论
你好,请问一下三面后多久收到了感谢信
点赞 回复 分享
发布于 2022-08-07 15:15
oc了吗
点赞 回复 分享
发布于 2022-08-04 22:02
算法题是不是力扣取k个频率最高的,需要自己写堆吗,用优先队列不行吗
点赞 回复 分享
发布于 2022-08-02 21:27
请问base哪里的啊
点赞 回复 分享
发布于 2022-08-02 17:13
你面了好多
点赞 回复 分享
发布于 2022-08-01 23:39
楼主是面完多久知道的结果呀?收到感谢信了吗?
点赞 回复 分享
发布于 2022-08-01 17:28
面得哪个岗位?
点赞 回复 分享
发布于 2022-08-01 16:21

相关推荐

一面80min:项目实习孤立森林的原理,one&nbsp;class&nbsp;svm的原理,这两者的区别oc-svm与普通svm的区别,损失函数是什么,怎么优化svm的kkt条件有哪些,分别有什么作用boosting和bagging算法的区别是什么随机森林和xgb的区别和适用场景是什么哪个更能控制方差,从概率论的角度分析gnn和gat的区别是什么,这两者有什么优缺点现阶段很多实时计算量是不用gat的,你知道什么原因吗,有没有可替代方案时序预测方法有哪些,你为什么在项目中选择这个时序预测方法,有没有选择其他的方法不能只从结果和业务的角度分析,需要更多考虑算法的底层逻辑的差距code:动态规划十分钟后二面,个人原因调整了面试时间,同时也换了面试官,这将是我最后悔的决定二面80min项目实习质疑项目的真实性和可靠性,全程觉得项目没什么用,做的实习毫无意义xgb分裂熵是怎么计算的,叶子结点的权重是怎么计算的,讲解相关的公式svm为什么使用核函数,有哪些核函数,其他方法也能进行高纬映射,为什么用了核函数讲解svm的计算流程和相关的公式lora的时候是微调的哪个部分,为什么是微调注意力矩阵,其他的呢,怎么微调的,从代码层面讲解,从公式上面证明讲解大模型原理,讲的太大了太空了,需要结合具体的公式进行分析code:连接两棵树后最大目标节点数2的变体,面试官当场手出,没做出来已挂
查看18道真题和解析
点赞 评论 收藏
分享
评论
2
22
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务