Checkboard问题。16年就有人对这一问题进行了研究$^{[1]}。 简单地说就是我们用的转置卷积(transposed convolution)操作(注意本质上不是deconvolution,反卷积)会产生这种现象; 解决的方案就是避免使用这种卷积,文章中作者使用的是resize-conv; 具体操作很简单: 对于输入,我们想要得到,经典的转置卷积通过使用stride为2的操作得到; 对于resize-conv,我们首先对输入作上采样,比如最近邻,双线性等插值,使其shape成为,再对其使用stride为1的普通卷积操作即可。 另外多说一点,对于TF框架,其相关的resize API有问题(至少我当时用的时候社区普遍反映过这一问题,1.x版本),这里特指tf.image.resize_images那一系列的API,若用,推荐令其第四个参数align_corners为True,原因以及该API现状具体可见相关社区讨论。 最后多说一句,搞淦搞算法,不保证就业,且爱且珍惜。 祝好:) Reference:[1] Deconvolution and Checkboard Artifacts [2] Github issues on TF's resize API [3] how-tensorflows-tf-image-resize-stole-60-days-of-my-life

相关推荐

更新:又挂了,三进宫失败——————————晚上7点面试的,全程一个小时多一些1. 自我介绍2. 面试官说我美团面过好几次了(看之前的面评) 还是挺优秀的(疑问❓都挂了好几次了) 然后我讲一下aaai2024论文3. 问一下她不明白的训练细节 怎么做 为什么这么做4. 问一下被ijcai2024拒掉的论文怎么做,为什么 达到什么效果5. 这篇被拒绝的怎么办(看老师让扔到哪里)6. 业务场景: 1. 如果有商家广告牌,可以做风格迁移吗,按照我那个论文的pipeline, 答:可以 但我更推荐去按照instantstyle方式,自己去train会更好,毕竟注意力机制就是语义匹配的 2. 如果有街景照片,你需要把不想要的去掉看起来也很真实怎么做: 按照sd的inpainting pipeline,现在又新出来一个brushinpainting 但我论文没仔细看,是类似reference Net形式7. 代码题: 全排列,lz代码能力差 又没写出来 我说写的答案不对 她让我讲一下思路,思路还是ok的8. 闲聊:1. 看我以前面评说有快手offer,怎么不想干了 2. 还有拿到了腾讯优图的offer已经,那么会怎么选在美团之间 考虑的是什么等等 3. 我更看重什么,想做什么(AIGC生成) 4. 对现在业务和预研的偏好9. 反问:是不是有二面, 转正率如何, 如何培养总结起来就是三战美团了,每次算法题都写不出来,我是废物另外可以给我们的开源项目点个赞吗? https://github.com/lyc0929/OOTDiffusion-train #面经#  #美团#
点赞 评论 收藏
转发
牛客网
牛客企业服务