
可灵 AI 在快手的重要性进一步上升。
文丨高洪浩
《晚点 LatePost》独家了解到,快手今日发布组织架构调整公告,宣布由快手高级副总裁、可灵 AI 事业部负责人兼社区科学线负责人盖坤兼任可灵 AI 技术部负责人,继续向快手科技创始人兼首席执行官程一笑汇报。
一位快手人士告诉我们,此次由事业部一号位向下兼任可灵 AI 技术负责人,体现出可灵 AI 在快手大模型整体战略中有着非常重要的地位,也意味着可灵将坚持 “技术驱动” 战略。
在快手,盖坤被认为是一位以技术见长的高管。他在清华大学就读本科与博士期间的研究方向为识别与智能系统;在阿里巴巴担任广告算法与 AI 技术研发负责人时,曾提出 “深层用户网络兴趣分布” 模型,并帮助淘宝、天猫等平台优化了用户点击偏好预测能力;到快手后,他主导了内容理解应用、推荐大模型及视频生成大模型等技术落地,并应用在了快手的算法、主站与商业化产品中。
此前,盖坤在快手任职时间最长的岗位是推荐广告搜索技术体系和大模型技术。外界对盖坤认知也源自通过推荐技术改革,推动了快手的人均时长快速赶到了和抖音差距不大的水位。
盖坤也是可灵崛起的重要推手。可灵大模型最早便是由盖坤带队的社区科学线团队开发的,这个团队许多成员原本的日常工作就是处理千万量级的视频内容,包括对视频的画质和内容做分析、标注等,而在做大模型时,“这种能力和工作流程是可以直接复用的。”
2023 年下半年,多数互联网公司的重心都在应用前景更明朗的大语言模型和图片模型上,但在盖坤的主导下,快手坚定将资源投入到了视频模型的研发上。次年 6 月,可灵大模型上线,这是全球第一个与 Sora 一致采用 DiT 路线,且直接面向普通用户开放的视频大模型。“完全没想到是快手最先做出来。” 一位字节跳动大模型研发人士说。
“我们知道这个赛道将会激烈,所以在发布之后,可灵 AI 就进入了 ‘狂奔’ 模式。” 盖坤曾在可灵 2.0 模型发布会现场回忆当时的情景。
可灵是快手当前优先级最高的业务之一。今年 4 月,我们曾独家提到,快手基于可灵 AI 组建了独立事业部,成为了与主站、商业化、电商、国际化、本地生活并列的一级业务部门,向快手董事长兼 CEO 程一笑汇报。
一位可灵人士告诉我们,在上半年的一场干部会上,盖坤要求可灵在 AI 视觉生产领域做到 “全球领先”。在发展路径上,他提出,要优先保证模型效果,并聚焦 P 端付费订阅会员,这也是包括 Runway 等在内的全球头部视频生成公司主要瞄准的客户群。“盖坤在内部多次提到,希望能用 AI 把《三体》的场景复现出来。”
盖坤也积极为可灵的发展争取内部资源。上述可灵人士称,盖坤在内部一直往可灵聚焦算力卡投入,协作部门也要给予可灵项目最积极地配合。
据了解,可灵 AI 在诞生后的一年时间里已迭代 30 余次。今年 4 月和 5 月,可灵分别推出模型的 2.0 和 2.1 版本,进一步强化了模型在可控性方面的能力。8 月 15 日,可灵 2.1 模型开启了全新首尾帧功能的内测,用户可以通过自定义首尾帧图像,生成连贯且高质量的视频内容,可灵官方称,这可以解决 AI 视频生成中的转场生硬、文本响应不足等痛点问题。
在技术迭代之外,可灵也在积极探索商业化。一位可灵人士称,这是为了保证产品能更健康与可持续地发展。今年 3 月,盖坤就曾在可灵 2.0 发布前的公司干部会上提出, 2025 年可灵在营收规模上要实现 “跨越式增长” 。
根据官方数据,自商业化以来至今年 2 月,可灵 AI 累计营业收入已超过 1 亿元。《晚点 LatePost》了解到,可灵 AI 今年前三个月的营收,已超过 2024 年下半年的总和,其中 P 端付费订阅会员为可灵贡献了将近 70% 的营业收入。
公告中还提到,张迪将不再担任可灵 AI 事业部技术部负责人。一位快手的人士评价,快手历来重视技术人才储备,在人才密度和厚度上也有足够积累。据《晚点 LatePost》了解,目前快手直接从事技术研发工作的员工占到全体员工的近半。
“做好基础模型,仍然是整个团队最核心的事。” 一位快手人士称,整个行业里面视频模型虽然发展很快,但还是有很大的优化空间,而基础模型的质量,无疑决定着可灵 AI 在竞争中的身位。
题图来源:快手