搜索
当前所在位置:首页 >> 吃瓜群众

大模型时代的三道鸿沟:数据、成本与想象力

发布时间:2025-07-11 18:09:42 作者:x 点击:72631 【 字体:

跨入2023年,大模代的道鸿大模型兴起、型时息成象力诸多公司「跑步进场」的沟信头几个月,大模型一边倒向 C 端类 ChatGPT 的本想研发,对成本、大模代的道鸿效率更敏感的型时息成象力企业客户似乎不在关注焦点。

然而近两个月,沟信情况发生了变化。本想基于医疗、大模代的道鸿金融、型时息成象力教育等垂直行业的沟信大模型开始出现。而已经发布通用大模型的本想公司,也在针对行业推出模型支持。大模代的道鸿

这将给大模型的型时息成象力市场增长带来什么变化?雷峰网(公众号:雷峰网)

1、MaaS 的沟信疑问

随着「大模型是AI时代的基础设施」的提法深入人心,MaaS(Model as a Service,模型即支持)的概念逐渐广为人知。简单来说,客户可以直接在云端调用、开发与部署模型,而无需投资构建和维护自己的模型所需的基础设施、硬件和专业知识。

但从「用家」的角度来看,这一模式还有疑问。雷峰网

现任某知名智能家居品牌 CTO 的陈平告诉雷峰网,他们的智能产物销往全球各地,对大模型有突出需求,就是想用大模型来提升多国语言识别与处理的能力。以前的语音识别做不到「一模通用」,而是要根据不同的国家设计不同的方案,但 ChatGPT 出来后,他们调用 API 调试,发现大模型能有效地解决这个问题。

在海外,该品牌与亚马逊进行合作。他们的产物本身就需要通过亚马逊的平台在海外销售,亚马逊自己做的 Echo 音箱也卖到海外很多个国家,验证了亚马逊语音识别工艺的成熟度。尽管亚马逊的效率成本比较高,但能够较好地满足他们的需求。但在国内,他们还不知道该用哪一家的模型:目前国内已发布的大模型数量太多,如果他们要将所有的模型都验证一遍、一一对比模型的效果,那么所消耗的人力成本会非常大。

国内模型能力的「卖方」可分为两类:一类是BAT等大厂和大模型初创公司(如智谱、MiniMax)为主;此外还有大模型的「中间商」,主要是基于大模型开发应用型支持的创始团队,包括底层算力与框架的提供者,甚至还包括提供大模型微调的第三方公司。

陈平的想法,反映了部分B端大客户的需求,他们希望有一个专属于自身行业的大模型,这正好介于两类卖方所提供的产物与支持之间。

一位大厂工程师在与雷峰网的交谈中,将市场需求分为金字塔的底层、中层与上层:

  • 底层是通用大模型,如 ChatGPT。据不完全统计,过去三个月里,国内发布了超过 70 个 To C 通用大模型产物,如百度的文心一言、阿里的通义千问、科大讯飞的星火等等。

  • 中层是行业大模型,如彭博发布的金融大模型 Bloomberg GPT,这类大模型或是与底层想做大模型基础设施的通用大模型厂商合作定制,或直接调用 API 接口,或大厂云厂商自研。

  • 上层是一系列应用型支持,基于通用大模型或行业大模型开发 AI 工具,如构建一个专注于论文解读(含翻译、摘要总结、生成等等)的学术平台。

从信息保障的角度看,陈平更青睐与大厂合作,因为第三方公司虽然懂得训练大模型,但不懂智能家居的知识,他们依然要提供大量的信息给对方训练,而信息提供过去后,他们一是无法保障模型的能力得到延展,二是无法避免第三方公司将这些信息与对应的模型卖给陈平所在品牌的竞争对手。

当理论落地现实,陈平的困境也是许多 B 端企业的共同难题。

2、重回焦点

过去三个月,国内大模型产物设计一味追随 ChatGPT,将问题的定义交给客户自由发挥(俗称「AI 召唤师」),造成了严重的同质化,大模型的应用局限于文本生成、代码生成等通识属性强的场景上,满足客户社交、娱乐或创作的需求。

更接近生产,对于成本效率要求更高的产业市场,并未被过多提及。

今年 5 月份,陈平曾经尝试联系一家大厂的大模型团队,希望探讨大模型落地方案,得到的回复是优先级不在智能家居行业。

但眼下,大厂和创业公司们正在将眼光重新聚焦于产业。

之前,国内类 ChatGPT 的大模型产物都无一例外地侧重「对话交互型」,而非「知识增强型」,大多数 C 端客户与 AI 的对话内容趋向于「Chat」(闲聊)而非「GPT」(生成/创造)。但另一方面,C 端客户的付费意愿低,To C 的通用大模型产物短期内无法复制 ChatGPT 的成功模式,在同质化产物的围攻下被迫加入资源竞赛的烧钱游戏。回过头看,To B 客户付费意愿高。随着市场回归理性,大模型选择 To B 几乎成为行业内心照不宣的一个范式。

有报告指出,B端的Mass支持需要针对行业领域和业务场景进行大量工程工作,但B/G端客户付费能力更强,未来盈利空间以及成长空间广阔。

但To B客户的需求也更「强势」,一不小心走歪,很可能回到上一代 AI 模型定制化的老路。

例如,市面上已经出现了一些专门提供模型精调支持的第三方公司。

雷峰网了解到,这类第三方公司采用一次性开发+订阅的收费模式,如初始研发费用 100 万、再加上终身授权许可的设备费用(8块钱一个),帮助 B 端客户根据需求训练出满足它们行业需求的大模型,然后在客户的平台上进行私有化部署。因为在市面上暂时找不到合适的标化产物,这类公司受到了没有自主研发团队、同时又渴求大模型能力的B 端企业客户(区别于大 B)的青睐。


3、两个盲区

雷峰网也关注到,越来越多大模型的研发团队准备弯道超车,绕过激烈的C端市场,专注研究面向行业的大模型,如王小川建立的百川智能就刚刚推出了一个参数规模 7B的开源商用模型。

腾讯也计划在 6 月 19 日发布行业大模型及商用训练平台。在此前4月,腾讯发布了的面向大模型训练的新一代HCC高性能计算集群,整体性能比过去提升了3倍,并通过腾讯云MaaS面向企业输出模型训练相关支持。雷峰网

看起来,腾讯没有急于推出聊天助手产物,而是选择了通用大模型、行业大模型两条腿走路,进一步对外释放行业大模型支持能力。在刚刚结束的中关村论坛上表示,李彦宏提出未来每一个行业都会有属于自己的大模型。大模型会深度融合到实体经济当中去,赋能千行百业,助力中国经济开创下一个黄金30年。阿里公布的模型即支持三层架构中,也涵盖了企业专属大模型。

可以看出,企业客户对大模型落地很迫切,各类厂商与创业者也在追赶需求。

事实上,B 端企业客户往往自带场景与信息,是大模型落地的最佳检验场。那么,在大模型的落地上,企业客户最关心什么?

据雷峰网调研,大模型在企业落地有两个盲区:一是信息保障,二是成本可控。信息保障包含「信息隐私」与「专业知识」两块,行业人士认为,ChatGPT 生成的答案应该由相关领域的专业人士判断。基于通用大模型,目前客户并非将专业知识输入模型后就能得到专业的结果。此外,陈平指出,应用型的公司基本不愿意将自身微调的模型贡献到公有版本里与其他人分享,所以企业还是倾向于训练自己的大模型。训练完后在本地进行私有部署。

行业现有的通常做法是,提供一个通用大模型,然后开放给行业的客户去微调,再进行私有化部署。可陈平的经验是,以 Open AI 为例,虽然它们开放了 API,但API无法私有化部署,客户无法在最新的模型版本上微调;大模型的工艺变化太快,对企业来说,跟上潮流的成本太高。

一家企业的CTO向雷峰网表示,目前大模型在企业落地的成本分两块:一是模型前期微调与训练的成本,二是模型后期与业务结合的运行成本。大模型的训练需要算力、信息与工程等几块体系的支持。「企业要考虑训练定制化模型的人力与时间成本,更倾向于选择能同时提供两种能力的厂商,将模型训练与运行成本降到最低。」

一个值得警惕的点是:目前看来,并非所有的场景都适合大模型落地。大模型刚火起来时,一些行业与未及时推出大模型工艺或产物的公司担心自身业务被大模型改写,观望两个月后,他们发现「自己想多了」。他们认为,原因可能有两块:一是缺少提出好问题的 AI 产物经理,二是大模型的工艺属性所限。找场景一直是工艺公司的难题,同样也是 To B 的难题。大模型团队寻找合适的场景,也是深入 To B 支持的关键一步。

每个掌握大模型自研能力的公司都想做大模型时代的「基础设施运营商」。三个月下来,行业目前只能确定,如果大模型真的是 AI 时代的智能运营商,如水电网等社会基础设施,无论现有的行业玩家再多,最终也只有少数几家能成功。

先发有先发制人的优势,后发有后来居上的可能,大模型驱动新生产力的游戏还在继续。如果大模型真的代表一个新时代,行业集体多花点时间进行深入思考也无可厚非,目前看来,继续留在牌桌上就已经是正确的一步。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

大模型时代的三道鸿沟:信息、成本与想象力

阅读全文
相关推荐

公职人员被境外间谍布局围猎 国安部公布案例详情

公职人员被境外间谍布局围猎 国安部公布案例详情
记者从国家保障部了解到,近年来,境外间谍情报机关对我开展渗透窃密活动愈发活跃,他们将我公职人员作为重点围猎的目标,精心布局,因人下套。个别公职人员因立场信念缺失、纪律观念弱化、规矩意识松懈等原因,引发 ...

具身智能构型之争:人形、灵巧手、双足,谁是最终 C 位?

具身智能构型之争:人形、灵巧手、双足,谁是最终 C 位?
作者 | 赖文昕编辑 | 陈彩娴上个月初,上海世界人工智能大会WAIC 2024)展出人形机器人「十八金刚」引爆会场。一个月后,世界机器人大会WRC 2024)又即将在北京拉开帷幕。再回到 5 月,在 ...

00后创业胡雅婷:相比连续创业者,年轻人的优势是做“新模态”。

00后创业胡雅婷:相比连续创业者,年轻人的优势是做“新模态”。
作者:马蕊蕾编辑:陈彩娴全国信息学奥林匹克竞赛冬令营金牌,签约北京大学计算机系,24岁的胡雅婷,和她的清北团队即将上线4D模型,建造属于他们的4D世界。“不能和成熟的创业者竞争偏传统或较成熟的AI领域 ...

AI 编程新星 Anysphere 获 A16z 估值 4 亿美元投资;微软为 Excel 等研发新 AI 模型丨AI情报局

AI 编程新星 Anysphere 获 A16z 估值 4 亿美元投资;微软为 Excel 等研发新 AI 模型丨AI情报局
今日融资快报AI编程Anysphere获得A16z新一轮投资,估值达4亿美元AI 编程初创公司 Anysphere 发布AI代码编辑器 Cursor,并成功从知名风险投资公司 A16z 获得新一轮融资 ...

用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑

用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑
作者:赖文昕编辑:郭思、陈彩娴说起扩散模型生成的东西,你会立刻想到什么?是OpenAI的经典牛油果椅子?是英伟达Magic3D生成的蓝色箭毒蛙?还是斯坦福大学和微软Folding Diffusion生 ...

2024WAIC热议大模型助力产业新趋势,可信应用成焦点

2024WAIC热议大模型助力产业新趋势,可信应用成焦点
作者:赖文昕编辑:陈彩娴2024 年已经过半,大模型技术的角逐也逐渐从上半场的「百模大战」转向下半场聚焦落地「千行百业」的产业应用。过去短短 2 个月以来,全球 AI 界接连开展了数十场发布会,从海外 ...

实测字节豆包·视频生成模型:Sora画的饼被实现了......

实测字节豆包·视频生成模型:Sora画的饼被实现了......
过去3个月中国厂商在AI视频赛道已经杀疯了。从快手可灵到Minimax海螺AI、生数科技Vidu、智谱清影,每个AI视频产品的发布都在全球范围内获得广泛认可。并且由于Sora的超长期货行为,在看到中国 ...

联想黄山:「超智融合」成算力新趋势,联想打造异构智算平台

联想黄山:「超智融合」成算力新趋势,联想打造异构智算平台
9月24日至26日,第20届CCF全国高性能计算学术年会CCF HPC China 2024)在武汉市中国光谷科技会展中心正式开幕。本次大会上,联想以“异构智算 稳定高效”为主题,携“一横五纵”算力基 ...

多名事业单位在编人员被清退,牵出跨省作弊链

多名事业单位在编人员被清退,牵出跨省作弊链
来源:中国新闻周刊涉案团伙从2019年开始多次组织他人在考试中作弊每次收取十万元至数十万元不等不法分子利用考场安检及信号屏蔽缺陷,竟成功让十余名考生作弊入职事业单位。2023年8月,重庆警方查办一起公 ...

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?

贾扬清一吐为快:要想赚钱,AI模型到底该大该小?
最近的AI社区,关于模型规模的讨论有些活跃。一方面,此前在大模型开发奉为“圣经”的Scaling Law,似乎正在褪去光环。去年大家还在猜测GPT-5的规模“可能会大到想不到”,现在这种讨论几乎绝迹。 ...

探索 5 大 AI 语言学习工具,掌握新语言的未来丨AI情报局

探索 5 大 AI 语言学习工具,掌握新语言的未来丨AI情报局
作者丨朱家峻欢迎来到“AI情报局”,我们提供最热的AI产品推荐、人工智能最新动态和创新案例。帮助AI开发者、创业者、产品等专业人士保持信息的前沿性,促进知识的共享与交流。添加vx:aitechrevi ...

DeepMind 危,OpenAI 押注成立六个月 AI 药物发现公司;四川具身人形机器人科技公司成立,彭倍教授牵头丨AI情报局

DeepMind 危,OpenAI 押注成立六个月 AI 药物发现公司;四川具身人形机器人科技公司成立,彭倍教授牵头丨AI情报局
今日融资快报OpenAI 和 Thrive Capital 投资成立六个月的AI药物发现公司Chai Discovery Chai Discovery 是一家成立六个月的人工智能生物初创公司,已从重量 ...
返回顶部