快手前AI核心人物李岩创业,投身“大模型”赛道
作者: 周鑫雨 邓咏仪
编辑:苏建勋 杨轩
又一名互联网技术大拿投身于AI赛道。
36氪从多个独立信源处获悉,快手前MMU(Multimedia understanding,多媒体内容理解)负责人李岩在2022年下半年成立了AI公司“元石科技”,主要进行多模态大模型的研发。36氪就上 述信 息向元石科技求证,得到了肯定的回复。
毕业于中国科学院计算技术研究所的李岩,是工号在75上下的快手老员工,也是快手AI技术研发的核心人物。2015年11月,在时任快手CEO的宿华的支持下,李岩组建了内部第一个深度学习部门DL(Deep Learning)组,目标是构建算法模型对违法违规的视频内容进行识别。
随着AI技术的积累,快手对视频内容理解产生了更多的需求。2016年,李岩将团队的名字从DL组改为MMU(Multimedia understanding,多媒体内容理解)组,在解决安全合规问题之外,涉猎语音、文字、图像等多种形式的算法模型研发。
几名知情人士表示,李岩于2021在快手提出离职,并于2022年下半年成立了元石科技。这一次独立创业,李岩也找到了最为适用于内容理解的技术路径—— 多模态大模型 。
所谓的多模态模型,指的基于文本、图像、视频、音频等多种模态数据进行学习训练的人工智能算法。简单而言,多模态模型就是一所AI综合院校,如百度即将发布的“文心一言”,就是基于多模态大模型“文心”训练而成的语言单模态模型。
早在2018年,李岩就在公开场合强调了多模态技术的重要性。在CNCC2018“高通量媒体内容理解论坛”上,李岩提到多模态内容理解对快手这样一家内容公司的战略意义:
“视频是视觉、听觉、文本多种模态综合的信息形式,而用户的行为也是另外一种模态的数据,所以视频本身就是一个多模态的问题,再加上用户行为就更是一种更加复杂的多模态问题。所以多模态的研究对于快手来说,是非常重要的课题。”
目前,国内企业的AI模型层竞争逐渐进入了白热化的阶段。前有百度、字节跳动等互联网大厂群雄逐鹿,后有创企利用各自的场景和数据优势竞相发力。
今年3月初,模型层企业又迎来两位强大的竞争者。3月2日,OpenAI以1000 tokens/$0.002(约等于100万个单词/18元)的“白菜价”发布了ChatGPT API。一天后,大股东微软在云计算平台Azure的全球版中正式上线了Azure OpenAI服务,支持企业级客户基于OpenAI的生成式AI模型进行场景创新和应用落地。
这对于成立于风口的元石科技而言,定是一场检验AI技术和行业沉淀的硬战。
Bitcoin Price Consolidates Below Resistance, Are Dips Still Supported?
Bitcoin Price Consolidates Below Resistance, Are Dips Still Supported?
XRP, Solana, Cardano, Shiba Inu Making Up for Lost Time as Big Whale Transaction Spikes Pop Up
XRP, Solana, Cardano, Shiba Inu Making Up for Lost Time as Big Whale Transaction Spikes Pop Up
Justin Sun suspected to have purchased $160m in Ethereum
Justin Sun suspected to have purchased $160m in Ethereum