无论文勇闯秋招算法岗——奇富科技一面

面试官状态很好,思维活跃

问了deepspeed zero,zero 1 2 3 的区别?

模型显存占用大小,全参微调 32B 要占多少显存?

sft 全参和lora的区别,什么时候用全参,什么时候用lora,lora的rank是什么意思,有什么用

grpo是on policy还是off policy的?

grpo 和 gspo的区别?

做题

超时删除,一个类,init(),get(key) value,set() key value 存下来

import timeclass TimeCacheDict:
'''
'''
def __init__(self,expire_time:int):
    self.cache = {}
    self.expire_time = expire_time
    self.key_time = {}
def set(self,key:str,value:str):
    current_time = time.time()
    self.cache[key]=value
    self.key_time[key]=current_time
def get(self,key:str):
    current_time = time.time()
    if key not in self.cache:
        return None
    if current_time - self.key_time[key] > self.expire_time:
        del self.cache[key]
        del self.key_time[key]
        return None
    return self.cache[key]
cache=TimeCacheDict(3)
cache.set("key","value")
print(cache.get('key'))
time.sleep(4)
print(cache.get('key'))
cache.set("key","value")
print(cache.get('key'))
time.sleep(2)
print(cache.get('key'))

说了一些格式上的问题

然后说轮训或者队列先进先出的方案会更好

地点是北京。

业务就是多模态文档,做一些决策,会用到VLM Qwen-vl gpt-4o等模型。

全部评论

相关推荐

10-11 15:57
门头沟学院 Java
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务