闷声狂奔一年，字节大模型的进阶之路

2024 年初，字节跳动 CEO 梁汝波在年会中提到，公司层面的半年度技术回顾里，2023 年才出现 GPT 相关讨论。作为对比，业内做得比较好的大模型创业公司基本在 2018 年到 2021 年之间已经创立。

一位字节员工曾告诉雷峰网，直到 2023 年 2 月，字节才开始探索大模型。彼时，国内一些更早入局的大厂甚至已经准备对外发布大模型。

简而言之，这场由 Open AI 在 2022 年底发布 ChatGPT 3.5 而掀起的“大模型”盛宴，字节没有成为最早的“入场嘉宾”。

过去一年多的时间里，字节在 AI，尤其是自研大模型领域，始终颇为低调，但这并不妨碍业内的期待。不少从业者在被问及最看好国内哪家公司的大模型产品时，都曾向雷峰网(公众号：雷峰网)提及字节。

其中原因也不难理解，无论从人才密度、GPU 资源，还是技术积累各个层面，字节都有着足够的优势。诚然，字节不是最早参与到大模型研究的公司，但却是为数不多在技术积累和 GPU 资源等维度都有着深厚积淀的公司。

移动互联网初期，今日头条便通过对算法推荐的成熟应用，突破新闻门户网站的束缚。从此，信息流产品成为各家互联网公司追逐的模仿对象。

在大模型训练必不可少的 GPU 卡方面，雷峰网去年在字节的大模型野心，藏在一艘「方舟」里已经提到，调研显示，字节的 GPU 卡在目前国内众多云厂商中排名 Top 3，并将其归因于抖音业务推荐平台的不断升级，以及火山引擎使用抖音同源机器学习平台对外服务的需求。

如今，字节终于揭开自研大模型的“神秘面纱”。5月15日，火山引擎春季Force·原动力大会上，字节跳动首次对外正式发布自研大模型：豆包大模型（原云雀大模型）家族集体亮相。

尽管不少圈内人已经听闻字节的大模型或创新低价格，但当火山引擎总裁谭待正式对外宣布价格时，豆包大模型还是给 AI 界来了一点小小的“字节式”震撼。

Your cart