大厂大模型,强在哪?

定焦One
+ 关注
2023-07-26 10:11
385次阅读
大厂大模型,强在哪?

今年以来,中国科技公司掀起“百模大战”,大厂、创业公司都发布了自己的AI大模型。

大模型越来越多,有闭源有开源,有通用也有垂直;企业做大模型的策略也不尽相同,有的坚持从底座做起,有的在开源架构之上抄近道。

不过,虽然路径有差异,但有一点逐渐成为行业共识——大模型要落地,得从产业开始。B端的使用效果,成为评价一个大模型靠不靠谱的重要指标。

做出一个大模型不难,难的是让大模型具备产业价值,在应用的时候稳定、安全、易用。

对于To B企业而言,面对如此众多的大模型产品,该如何选择?

短短半年时间,大模型创业就经历了共识之变。

年初,很多人认为,通用大模型是未来。大家看到GPT3.5大模型强大的泛化能力,感到非常兴奋,认为大模型似乎可以解决一切问题。

这里简单科普一下,大模型分为两类,一类是通用大模型,可以聊天、问答、通用数理计算等,另一类是垂直大模型或行业大模型,面向产业,突出应用,强调降本增效的作用。

有创业公司基于开源的大模型,快速做出了一些有意思的产品,AI绘画、AI写作、AI数字人等火爆。

然而没过多久大家发现,做出类似产品的门槛不高。受制于算力的稀缺性,很难将大模型包装成类似微信这种大范围使用的付费C端产品。而大模型训练的成本很高,部分参数量很大的大模型,训练一次动辄耗资数千万。

盲目烧钱不可持续,如何让大模型在产业里发挥作用,产生价值,成为很多大厂考虑的问题。

百度就发现,文心一言发布后,一开始来交流的企业都是CEO级别的人出面,后来大多是技术负责人或业务负责人。字节跳动发现,来找火山引擎的企业,四五月份都是模型厂商,需求是训练模型,现在是一些行业客户,希望在营销、客服等场景落地。

从玩具到工具,落地才是王道。所以我们看到,近期国内科技公司新发布的大模型,大多都面向垂类产业落地。而垂直行业里的企业们,都有很强的降本增效的需求。

这导致一个结果,全球的基础大模型,现阶段都主要面向To B行业市场。

To B客户在选择大模型产品时,应该重点考察哪些方面?

首先,有没有“云”很重要。

这波AI 2.0浪潮,很多能力都是建立在云平台之上。通过云平台输出模型能力,支撑更多应用生长,是一套比较高级的打法。

大模型离不开云厂商。国内现在跑的最快的大模型公司,如百度、阿里,都有自己的云业务。而在它们公司内部,云部门也是冲在最前面。

这是大厂跟创业公司非常大的一个区别,即便是OpenAI,也要借助微软云平台Azure。而微软也借此实现了对OpenAI更强的控制,成为其独家云厂商。

一些在算法上实力不弱的创业公司,也许能在很短时间内,基于开源代码开发出自己的大模型,但它们没有自己的云底座,必须得找云厂商合作,后期在系统部署、数据归属、利益分成方面,难免存在隐患。

其次,要看有没有“生态”。

大模型创业的生态分为四层——芯片层、框架层、模型层、应用层。其中芯片层+框架层是基础设施,企业的进入门槛最高;模型层对算力、算法、数据、人才的要求非常高;应用层是基于前两类大模型,调用API开发应用。

所有的玩家都要在这四大层级里站位,纵向覆盖的层级越多,竞争壁垒越深厚。

中国的科技公司在布局时,尤其是BAT这样的超级巨头,往往会交叉覆盖四大层级。基础打法是先发布通用大模型或者行业大模型底座,其他公司再基于这些基础模型,结合自身拥有的行业数据,微调出自己的大模型应用。

最后,服务体验也不能忽视。

企业客户在选择大模型时,不能只看中技术实力,是否懂行,能否保证交付,运维有没有长期保障,同等重要。

以上这三个方面,将决定哪些公司的大模型产品,更能获得客户青睐。

综合来看,大厂的优势明显。

业界普遍认为,百度、阿里、华为是综合实力排名靠前的玩家。

就像当年的云计算市场一样,底层算力和平台能力可以构建壁垒,市场需要算力强悍、模型全面的服务商。那些在算力、平台、模型、应用方面都有布局的大厂,对企业客户具备更强吸引力。

百度、华为,除了自研大模型产品,还完成了从芯片到应用的布局。百度是“昆仑芯+飞桨平台+文心大模型”,华为是“昇腾芯片+MindSpore框架+盘古大模型”,这是其他公司在短期内很难追上的优势。

也是基于这些优势,大厂一方面在技术上做到了领先,另一方面在服务客户上更接地气。

比如百度,百度是国内第一个推出类ChatGPT产品,开放内测,硬刚ChatGPT的公司。在SuperCLUE中文大模型7月最新榜单中,百度的大语言模型产品文心一言,以62分的总成绩超过了GPT-3.5-turbo和ChatGLM-130B。IDC最新发布的《AI大模型技术能力评估报告,2023》中,百度文心大模型3.5拿下12项指标中的7个满分,综合评分第一。

现在,国内的大模型厂商,都在积极拓展ToB业务。百度的文心千帆,是全球首个一站式企业级大模型平台,可以为企业提供从数据处理、模型训练、模型部署到模型运维等全流程的大模型服务。

因为有完善的工具链,配套更丰富,文心千帆在为客户提供服务时,能更全面、更易用、更安全。这大大降低了企业开发大模型的门槛,基本接近“开箱即用”的效果。

抛开这些硬实力,在软实力方面,大厂的优势也很明显。无论是资金储备、人才厚度,还是产业洞察、数据积累,都非创业公司所能比。大厂过去十几年的经验,在持续构建竞争壁垒。

尤其是在垂直行业资源方面,大厂布局很深。百度一口气推出十多个行业大模型,华为推出矿山大模型、实时预测全球海浪的大模型,以及京东面向零售、金融、城市、健康和物流领域提供行业解决方案,都体现出大厂已经在“用大模型赋能千行百业”。

这场AI大模型的长跑,不同背景的玩家,并不是站在同一个起跑线上。

具备资金储备、生态能力、产业洞察、战略意志的实力玩家,最有可能率先到达终点。

本文来自「定焦One」,36氪经授权发布。

[免责声明]

原文标题: 大厂大模型,强在哪?

本文由作者原创发布于36氪企服点评;未经许可,禁止转载。

资深作者定焦One
0
消息通知
咨询入驻
商务合作