大模型

闷声狂奔一年,字节大模型的进阶之路

2024 年初,字节跳动 CEO 梁汝波在年会中提到,公司层面的半年度技术回顾里,2023 年才出现 GPT 相关讨论。作为对比,业内做得比较好的大模型创业公司基本在 2018 年到 2021 年之间已经创立。

一位字节员工曾告诉雷峰网,直到 2023 年 2 月,字节才开始探索大模型。彼时,国内一些更早入局的大厂甚至已经准备对外发布大模型。

简而言之,这场由 Open AI 在 2022 年底发布 ChatGPT 3.5 而掀起的“大模型”盛宴,字节没有成为最早的“入场嘉宾”。

过去一年多的时间里,字节在 AI,尤其是自研大模型领域,始终颇为低调,但这并不妨碍业内的期待。不少从业者在被问及最看好国内哪家公司的大模型产品时,都曾向雷峰网(公众号:雷峰网)提及字节。

其中原因也不难理解,无论从人才密度、GPU 资源,还是技术积累各个层面,字节都有着足够的优势。诚然,字节不是最早参与到大模型研究的公司,但却是为数不多在技术积累和 GPU 资源等维度都有着深厚积淀的公司。

移动互联网初期,今日头条便通过对算法推荐的成熟应用,突破新闻门户网站的束缚。从此,信息流产品成为各家互联网公司追逐的模仿对象。

在大模型训练必不可少的 GPU 卡方面,雷峰网去年在字节的大模型野心,藏在一艘「方舟」里 已经提到,调研显示,字节的 GPU 卡在目前国内众多云厂商中排名 Top 3,并将其归因于抖音业务推荐平台的不断升级,以及火山引擎使用抖音同源机器学习平台对外服务的需求。

如今,字节终于揭开自研大模型的“神秘面纱”。5月15日,火山引擎春季Force·原动力大会上,字节跳动首次对外正式发布自研大模型:豆包大模型(原云雀大模型)家族集体亮相。

尽管不少圈内人已经听闻字节的大模型或创新低价格,但当火山引擎总裁谭待正式对外宣布价格时,豆包大模型还是给 AI 界来了一点小小的“字节式”震撼。

Share this post

About the author

人工智能先行者-薛老师

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注