无论文勇闯秋招算法岗——奇富科技一面
面试官状态很好,思维活跃
问了deepspeed zero,zero 1 2 3 的区别?
模型显存占用大小,全参微调 32B 要占多少显存?
sft 全参和lora的区别,什么时候用全参,什么时候用lora,lora的rank是什么意思,有什么用
grpo是on policy还是off policy的?
grpo 和 gspo的区别?
做题
超时删除,一个类,init(),get(key) value,set() key value 存下来
import timeclass TimeCacheDict: ''' ''' def __init__(self,expire_time:int): self.cache = {} self.expire_time = expire_time self.key_time = {} def set(self,key:str,value:str): current_time = time.time() self.cache[key]=value self.key_time[key]=current_time def get(self,key:str): current_time = time.time() if key not in self.cache: return None if current_time - self.key_time[key] > self.expire_time: del self.cache[key] del self.key_time[key] return None return self.cache[key] cache=TimeCacheDict(3) cache.set("key","value") print(cache.get('key')) time.sleep(4) print(cache.get('key')) cache.set("key","value") print(cache.get('key')) time.sleep(2) print(cache.get('key'))
说了一些格式上的问题
然后说轮训或者队列先进先出的方案会更好
地点是北京。
业务就是多模态文档,做一些决策,会用到VLM Qwen-vl gpt-4o等模型。