一面6月15号下午4点一个小时讲比赛,瞎聊梯度下降求平方根,力扣只有二分和拟牛顿写法,写了好久靠面试官提示写出来了。。def sqrt(y): xt=0.0001 l=0.001 thresh=0.001 while abs(xt*xt-y)>=thresh: loss=1.0/2*(xt*xt-y)**2 dx=(xt*xt-y)*2*xt xt=xt-l*dx return xtbert和gpt的区别lr的参数初始化为全0有什么问题bert为什么mask 8 1 1反问:去年都全部转正了,今年不知道,实习主要做时序lr的八股居然在我收藏的八股文里有,但我没咋看[好无辜]