不能承受的「平庸」之重:字节跳动的AI反击战

yxiaolang 2024-05-23 283次阅读

编者按:本文来自微信公众号 智谷趋势(ID:zgtrend),作者:王延鹤,清水号经授权转载。

字节跳动,已无法再低调。

• 外媒报道,字节跳动2023年营收1100亿美元,可能超过腾讯、逼近Meta;

• TikTok在美国渡劫,作为增长引擎的海外业务遭遇不确定性;

• 字节跳动在AI竞赛上显得“迟钝”,公司内部“到2023年才开始讨论GPT”;

作为估值超千亿美金的独角兽,字节跳动对外信息披露一贯低调,但行动上其疾如风。身处复杂局势正中心,字节跳动能主动作为、取得战果的突破口,落到了AI。

国内像百度、阿里、华为、科大讯飞等企业布局AI大模型,从去年3月陆续推出测试产品。字节跳动主推的AI智能助手“豆包”,直到8月份才上线。

然而,据QuestMobile数据,2024年3月,豆包App月活用户2328.2万,在AIGC类应用已排名第一;到4月,豆包在苹果中国区的AIGC类应用排名最高,在安卓市场累计下载量破1.3亿。

“大力出奇迹”的流量法则,在字节跳动的AI产品上再次生效。

5月,则是AI超级大月。OpenAI更新GPT-4o,谷歌I/O大会全线更新,微软将公布自家AI和Copilot,阿里发布通义千问2.5……预计“王炸”、“颠覆”等词语会持续刷屏热搜。

5月15日,在火山引擎Forece原动力大会上,字节跳动正式发布自研的豆包大模型。

火山引擎总裁谭待表示,

经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成3000万张图片。

不仅如此,字节跳动更推出“杀手级”定价:豆包主力模型推理输入定价仅0.0008元/千Tokens,比行业价格便宜99.3%。

在AI竞赛的光谱中,OpenAI是典型的高举高打,占据注意力的中心。而中国大厂普遍信奉“慢就是快、大器慢成”的古典哲学,以及应用创新、产品落地的实用主义。

无法低调的字节跳动,正以自己的节奏冲入AI战局。

01

危机感来自哪里?

“最大的危机感,是担心字节跳动作为一个组织,正在变得平庸,无法取得新的突破。”

1月30日,字节跳动CEO梁汝波在年度全员会上进行了批评。

中国互联网大厂今年集体反思。字节跳动,往往是大厂语境里要防备的对手,一个掌握超级流量、攻入业务腹地的破局者。

而梁汝波认为,字节跳动在AI上更显得“迟钝”:

字节跳动对技术的敏感度不如创业公司,直到2023年才开始讨论GPT。业内做得好的大模型创业公司,都是在2018年至2021年创立的。

2018-2021年,中国互联网大厂经历了一波AI人才流失。吴恩达、张潼、贾佳亚、金榕等AI Lab负责人和科学家大量出走,回归学界或是参与创业。

同期,OpenAI已迭代到GPT-3,展示的对话、下棋、文字等能力,在业内掀起讨论。谷歌也发布BERT模型和Transformer架构,为Scaling law奠定基础。

字节跳动内部也训练了一个几十亿参数的模型,国内也有百度ERNIE模型、阿里M6和Plug、华为盘古模型等跟进,但据业内人士复盘,彼时大厂对AI的投入更偏重特定任务,而不是大语言模型,因为看不到商业化前景。

直到2022年11月30日,ChatGPT正式发布。改变历史的一夜后,大模型成了“不能错过的革命”。

OpenAI觉得,成功是意料之外;对其他大厂,不存在侥幸一说。

字节跳动在2023年初开始讨论GPT。但随后一年,字节跳动调集了所有力量追赶,并快速取得战果。

公开资料显示:

•2023年2月,字节跳动组建“Seed”团队,从国内外、多部门调集人手攻坚AI,并从新加坡调回TikTok产品技术负责人朱文佳带队。

• 6月,字节跳动旗下云服务平台火山引擎推出“火山方舟”平台,提供模型训练、推理、精调等服务。如月之暗面、智谱AI、MiniMax等明星公司,早期都在火山引擎训练模型。

• 8月,国家首批通过备案的AI大模型名单出炉,字节跳动云雀大模型,与百度、商汤、中科院、MiniMax、智谱AI、百川智能、上海人工智能实验室等8家入选,可正式向公众开放服务。

• 8月,字节跳动内测项目Grace改名“豆包”,作为AI智能助手产品正式上线。

• 11月,字节跳动组建Flow部门,负责AI大模型应用的研发。字节跳动产品与战略副总裁朱骏、技术副总裁洪定坤,分别担任Flow部门的产品、工程负责人。

• 2024年2月,字节跳动上线AI智能体应用开发平台“扣子”,对标OpenAI的GPTs,成为豆包后重要的AI阵地。

• 5月,字节跳动发布自研“豆包大模型”。同时,也意味着火山引擎和微软Azure、阿里云、百度智能云类似,将自研大模型与云服务结合,正式对外提供服务。

02

字节跳动的核心是算法技术,所以他们骨子里自认为是一家AI公司。

在移动互联网时代,字节跳动善于打造爆款应用,被称为“App工厂”。

在字节跳动内部,爆款公式叫作“大力出奇迹”,即:超级流量+超级算法,通过重资本、强运营做热启动,快速获取用户基础。

冲入AI战场后,字节跳动的产品基因依然在发烫,是靠做应用产品在驱动。

一年时间,字节跳动已经推出了AI对话助手“豆包”,AI智能体开发平台“扣子”,互动娱乐应用“猫箱”,AI教育“河马爱学”,AI创作工具“星绘”、“即梦”等11款AI应用产品。

字节跳动推出的AI产品,在市面上基本都能找到对标品,而依靠“大力出奇迹”的方式,字节跳动在用户积累上迅速取得战果。

去年8月上线的豆包,目前月活用户已经超过2600万,豆包App的累计下载量超1亿,支持创建的智能体总量超过800万。

豆包图片

今年2月上线的扣子,被称为“字节跳动的GPTs”。作为AI应用开发平台,起到了连接大模型和用户场景,组成完整生态的关键作用。用户不需编程技巧,就能在扣子平台上快速搭建基于AI模型的各类bot,据传日活用户目前已经超过百万。

扣子图片

一年的狂飙,字节跳动搭建了公司的AI组织队伍,在针对性的业务防御后,通过“大力出奇迹”拿到了初步战果。

应用层多点开花,打造新AI产品工厂,字节跳动在寻找下一个爆款产品,制造AI时代的“抖音”。

此次发布自研“豆包大模型”后,字节跳动也完成了通用大模型和基础设施的关键补位,并将大模型品牌收束到“豆包”名下(原名“云雀大模型”)。

豆包大模型,事实上是一个具备多模态能力的“模型家族”,包括:通用模型pro/lite、角色扮演模型、语音合成模型、语音识别模型、声音复刻模型、Function call模型、文生图模型、向量化模型等9款模型。

不同的模型,针对不同的场景。最受关注的是2个豆包通用模型:

• pro版本提供窗口尺寸128k、全系列可精调的满血性能。

• lite版本则是快速响应,追求更低延迟和更低单位成本。

过去一年,豆包大模型已经引入了字节跳动内部的抖音、巨量引擎、飞书、大力教育、番茄小说等50多个业务,在营销、电商、办公、创作、编程等多场景进行优化效率和产品体验。

崇尚算法的字节跳动,也在让AI成为业务增长新的“放大器”。

例如,抖音集团前CEO张楠调往剪映之后,也在5月推出了类Sora的视频生成AI“即梦”,为最瞩目的视频领域开辟想象空间。

字节跳动在用自己最熟悉的打法,攻占C端的AI市场。

03

如果大模型是一场马拉松,我们还在起步的100米。

to C的AI应用,制造一个“抖音级”爆款,是马拉松的长远目标;

而字节跳动展露的当下野心,是让加持自研大模型的火山引擎云服务,攻入to B企业服务市场的腹地。

字节跳动对豆包大模型,推出了“杀手级”定价。

以豆包通用模型pro-32k为例,其模型推理输入价仅为0.0008元/千Tokens,远远低于行业价格。市面上同规格模型定价,约0.12元/千Tokens,价格为豆包的150倍。

满血性能的豆包通用模型pro-128k看,价格也是0.005元/千Tokens,而GPT 4-Turbo 128k是0.07元/千Tokens,价格是豆包的14倍。

现场用一张图片,比较了目前大模型的定价,成为大会最高潮出圈的环节。

根据火山引擎计算,1元钱就能买到豆包主力模型的125万Tokens,大约是200万个汉字,相当于3本《三国演义》。

火山引擎总裁谭待表示,

降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。

大模型从以分计价到以厘计价,将助力企业以更低成本加速业务创新。

大模型这个赛道,字节跳动不是第一个打价格战降价的,但把战况打到了新的烈度。

百度、阿里、腾讯都已通过云服务对外提供自研大模型,并通过降价、用户免费等方式开展竞争。今年4月,百度宣布文心大模型的推理性能将提升105倍,而成本降到1%;阿里云全线下调产品价格,发布通义千问2.5后,对个人用户开放了免费使用。

价格只是表象,AI大模型赛道想要做大蛋糕,关键还是企业应用场景太少。

大模型的推理成本,随着规模的扩大,之后可能仍会以每年10倍甚至几十倍的速率下降。到了100块钱就能买1亿Tokens的时候,企业有什么想法都可以尝试,不必再受缚于成本预算,这样才有AI应用爆发的可能。

OpenAI的CEO山姆·奥特曼在最近采访中表示,他相信高质量AI智能的成本将变得非常低廉,最终趋近于零。

OpenAI开放GPT-4o后,金沙江创投合伙人朱啸虎进行点评:

1.大模型的技术迭代曲线明显放缓。

2.开始卷免费,说明GPT的用户和收入增长都已经碰到瓶颈,不是深度绑定大厂的模型公司基本已经出局。

3.应用会迅速爆发,推理成本再降一个数量级就会普及出现AI时代的国民应用。

这也代表了国内在大模型领域,普遍信奉的实用主义:大幅度降低大模型的推理成本,让产品落地和企业使用,在实践中推动AI发展。

火山引擎的总结,更直接:先用起来。只有最大的使用量,才能打磨出最好的模型。

国内AIGC用户渗透率目前只有6%。不管发布会上的AI,有多么“像魔术一样”,AI大模型高昂的成本,最终仍要B端企业来买单。

企业是最为严格的“价格敏感”客户,不会付费购买一个精美的玩具或艺术品,而是需要实打实的工具、效率和规模化。

具体到AI大模型,企业的直观痛点:价格太贵、落地太难、效果有限,还存在安全上合规与信任的问题。

谭待表示,今年行业不再比拼参数规模,因为大家都“悟”了:

大模型降价,不能只提供低价的轻量化版本,主力模型和最先进的模型也要够便宜,才能真正满足企业的复杂业务场景需求,充分验证大模型的应用价值,从而催化出超越现有产品和组织模式的创新。

字节宣布降价之后,业内纷纷跟进,又掀起了新一轮热潮。

5月21日,阿里云发布降价公告,对通义千问的9款模型进行大幅降价,其中Qwen-Long降价97%,输入价格0.0005元/千tokens,比豆包通用模型-pro 还要便宜0.3厘,仅比豆包通用模型lite 贵0.2厘;

21日下午,百度智能云公布,将两款轻量化模型ENIRE Speed、ENIRE Lite全面免费,即刻生效。

从全球来看,企业在加码对云服务投入的趋势明显。微软Azure作为OpenAI的独家云服务商,已经吃到了AI需求的红利,过去一年的营收和利润增速极为惊人。

从2021年,火山引擎进军IaaS,代表了字节跳动进军云服务市场,直接与阿里、华为、腾讯竞争的雄心。

在C端的AI应用大力出奇迹后,火山引擎将承载B端的攻坚任务,成为字节跳动的增长引擎。

火山引擎去年6月就发布了大模型服务平台“火山方舟”,此次大会推出了升级版的“火山方舟2.0”,系统性让企业先把大模型用起来。要让企业老板们对AI的热情,像抓抖音流量那样炽烈。

除了价格便宜之外,火山方舟对模型训练、系统稳定、核心插件、安全服务等都做了优化。

在算力层面,字节跳动是目前国内算力储存最为充足的企业之一,火山引擎的海量GPU资源,能够进行潮汐调度,分钟级完成千张GPU扩容的弹性,与秒级响应的精调模型,能有效承载企业的调用需求。

火山方舟此次重点更新了插件生态,为广大企业调用字节跳动在内容、算法、生态上的核心资源。

•联网插件,提供头条抖音的搜索能力,能实时联网学习,并通过多模态交互。

•内容插件,提供头条抖音的海量内容,支持对视频内容的理解、检索、多模态交互和内容生成。

•RAG知识库插件,提供毫秒级百亿规模的高性能检索,秒级流式知识库索引更新,内置豆包向量化模型,提升搜索能力。

针对开发者,火山引擎同步推出了“扣子专业版”,作为企业级的AI引用开发平台,帮助企业打造自己的智能体,并通过飞书、微信等平台发布,或者直接用API搭载到终端硬件设备。

目前,火山引擎已经在智能终端、汽车、金融、消费等行业展开合作,打开了B端市场的突破口。如OPPO、小米、三星、广汽、蒙牛、招商银行等企业,已经与火山引擎进行了人工智能相关的业务合作。

用低价开路,技术、算力和服务跟进,火山引擎在形成自己“大力出奇迹”的策略,并通过更大的B端企业群,更大的使用场景,不断打造更聪明的AI,更高的效率提升。

字节跳动想要“逃逸平庸的重力”。

这家最懂打造爆款产品的公司,想制造AI时代的下一个“抖音”,更想要开动火山引擎,让AI成为水电一样的底座、企业增长的引擎。他们调动组织资源、召回技术大将,在大力出奇迹中赶上竞速的第一梯队,并带头击穿了行业的地板价。

字节跳动,终于又找到一个值得All in、放手去冒险的无边界战场。

本文为专栏作者授权清水号发表,版权归原作者所有。文章系作者个人观点,不代表清水号立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。




发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。