「了不起的技术人」哈哈哈谁懂啊!他怎么做到每天都乐呵呵工作的

淘天背后有一些了不起的技术人,他们坚持在各自领域全心投入、追求终极,或勇闯未知、或拒绝重复、或打破常规。

《了不起的技术人》是一档致力于打捞宝藏技术人的内容栏目,只记录真实,看见技术背后的Power。第三期,我们迎来@梦行(化名),一起踏入他在万相新世界,探寻快乐生活的每一天。

很多人都喜欢在聊天的最后回复:哈哈哈。笑有时是一种社交方式,有时也是一种掩饰。但我们忘记了,笑可以驱散阴霾。

(本期海报虚拟人物及相关配图,均由AI工具生成)

【人物小传】

他毕业于厦大计算机专业,赶上最早深度学习的热潮,加入AI隐形部队——深度学习研究院。在深耕视觉领域五年后,他满怀对业务实践的热情,加入阿里妈妈。即将在淘天收获第2个“五年”的他,向我们讲述着AI十年进阶的风云变化。

「哈哈哈」是采访记录里他本人最多的词条。除了“代码能改变世界”的理想外,或许他还相信,笑容也能改变世界。谈到有什么事情会让你不高兴吗?爱笑的他又露出“乐呵呵”的表情,连眼睛也弯成了一座桥:希望万相实验室的AI生图在“开盲盒”的时候,别给我出badcase啊!哈哈哈!

【TA的故事】

(全文共计1636字,看完需要5-6分钟)

有人说,今天AI的繁荣,仿佛是10年前的移动互联网。作为局中人的他,也亲身经历着这门技术“从群嘲到封神”。2014年,他幸运地踏入早期AI投入的大年——在深度学习研究院里钻研和打磨视觉算法。五年后,他自己也主动酝酿了一次突破。

躬身投入,每一步都算数

因为是技术人里的活跃分子,他总想着怎么把技术能力应用到业务里,再好奇地观察可能带来的改变。2019年,循着对阿里技术在互联网的影响力,他举家从深圳搬到杭州。

加入阿里妈妈,他一直沉浸在视觉与图像领域,先后带领团队攻坚搜索广告创意和多模态搜索广告。冲击和变化发生在去年下旬:Stable Diffusion 带来了令人咋舌的秒级生图技术,整个部门的小伙伴持续关注着这门技术的演进,今年月财新年伊始,阿里妈妈迅速成立了一支智能创作与AI应用团队。

在追赶新技术的过程中,他作为智能创作项目技术PM,更是与时间赛跑,在5月上旬阿里妈妈顺利发布了全新产品——「万相实验室·万相融绘」,支持对商品进行创图背景生成。

万相融绘是一款以视觉算法为核心,为商家提供商品图制作的AI创意生产工具。让所有平台商家都可以在万相实验室轻松创作商品创意,为商家的内容创作和经营降本增效,这是万相实验室的使命。

版本上线前,每一位参与其中的小伙伴(从设计师到产运研)忐忑又兴奋,就像在孕育一个孩子,因为没有人知道真实商家使用后的反馈。这时,他和团队小伙伴大胆提议,“不如先请商家提前解锁新功能如何,即使是吐槽也是一种声音呀?”。

初期的版本是需要商家上传10张商品白底图制作商品定制模型,虽然效果喜人,但仍有不少商家反馈,操作太过复杂。随后,在认真亲听了商家的建议后,他和小伙伴们短时间上线了第二套技术方案。实际在首批内测阶段,超70%的内测商家在尝试了AI生图的效果后,发现图片更精美,点击率也有提升。

面对需要夜以继日调整方案,梦行(化名)的脸上依然挂着笑容,传递出一股强大的自信。“这算是个小插曲,但却是商家真实的诉求,简化操作,让一张商品图搞定所有。”

不过为了达成理想的成图效果,为每个商品定制模型的方案是当时技术阶段的效果‘最优解’,并且在阿里妈妈合作的大客户中,对商品图有更高诉求,包括商品自由视角、品牌调性等等,后续也服务了客户高级定制的应用。“咱们的技术能力也没白建设,哈哈!”他再次轻松回应道。

日新为道,探索从不止步

经过6-8月的快速发展,梦行(化名)和小伙伴们已陆续完成了换模特、加元素、建布局等技术能力的升级。他们甚至在内部总结了一套AI生图评判标准:美(背景丰富度)、真(商品还原度)、融(商品和背景融合度),同时他和团队提出了一套局部控制生成方法,可以有效的平衡“美/真/融”的三者关系。

现在,他和他的小伙伴还极力突破“开盲盒”的挑战,即每次生图的效果尽可能让商家满意,让每张AI图片都能为商家所用。商家也可以在操作后台,通过对每张图的点赞或不赞来表达自己的态度,通过商家的反馈数据,来对产品效果的定量分析和优化。

今年双11,为让真实性的表现更加极致,技术团队还引入基于3D手部重建的修复方案,可以解决50%的手部生成失败问题。这不仅是他们的原创技术,更是业界首个支持在AI生图后可编辑的手部修复方案。

眼下,万相实验室已经保持了每1~2月一个版本的迭代,并在今年双11实现了第六版发布。万相生图能力接入广告营销平台“万相台·无界版”,让商家可以更加便利的使用上AIGC创意图。

在对未来产品形态的想象上,他还提出,“未来可期的多模态技术可能会加速到来。这两周,我们已经能支持AIGC商品图一键动起来,即阿瞳木视频动效,未来帮助商家制作更加有挑战的视频、3D特效、虚拟人等创意。这是咱们下一步需要破的题!”

编者小记

初见梦行(化名),就被他灿烂的笑容感染。这位不由自主喜欢“哈哈哈”的算法人,在提及专业领域的新知时总是侃侃而谈。

纵观他这一路的成长,是拥抱新事物表现的开放心态,亦是对探索新世界的积极热情,才让每一次技术热浪眷顾着他。今天又有什么值得快乐的事吗?原来是每一点细微的声响都值得我们歌颂啊。

#晒一晒我的offer#
全部评论

相关推荐

比亚迪 应用工程师 2.5k
点赞 评论 收藏
转发
点赞 收藏 评论
分享
牛客网
牛客企业服务