本期是通俗易懂大模型第十期,感谢大家持续关注。

上一期,给大家讲了什么是CPU、GPU、算力,英伟达为啥能一家独大。这一期,想给大家用通俗易懂的语言讲讲基础级大模型、行业级大模型、场景级大模型都是怎么划分的,之间的关系是什么,对应的大模型都有哪些特点。

1、先说一下大模型的分类

需要说明的这里的分类不是按照大模型的用途划分(之前在第一期的时候给大家做过一个不同大模型用途的类别划分),而是按照大模型的应用大类来进行划分。

大模型按照应用大类通常来讲分为基础级大模型、行业级大模型、场景级大模型

2、基础级大模型的通俗解释及应用场景

基础级大模型,可以理解为知识渊博的”百科全书”,知识范围广而大,像读遍图书馆的学霸,通过海量通用数据(如书籍、网页、新闻)学习,能回答常识问题、写文章、翻译语言。训练这类模型需要超级计算机级别的硬件(上期提到的GPU算力),而且这个类型的大模型本身并不具备特别有针对性的专业领域知识,更多是具备一些通用能力,涵盖语言、视觉、多模态、问答等方向。

现在大家常见的一些大模型,比如美国Meta的Llama系列、OpenAI 的GPT系列、阿里通义千问、DeepSeek V3、百度文心一言、华为盘古大模型等都属于基础级大模型。其核心特点是通用性和高扩展性,它们通过海量数据训练获得广泛的知识储备,并可作为行业级、场景级模型的开发基础。

基础级大模型可以处理、解决通用性的事务,通常面向全部的用户群体,比如让智能客服回答”明天天气怎么样”等通用问题,帮你写朋友圈文案的AI助手,帮你生成通用型图片的文生图智能助手等都属于基础级大模型。

3、行业级大模型的通俗解释的应用场景

行业级大模型,就类似于某个领域的“领域专家”——专攻一个行业,能用专业术语高效解决特定问题。

行业级大模型通常是通过基础级大模型,在某一行业领域基础上,经过进一步专业领域知识训练、微调/精调(具体什么是微调/精调,上几期都讲过,本期不再赘述,大家感兴趣可以往前翻翻),从而得到的。

比如医疗行业大模型会学习病例、药品说明书,金融行业大模型会分析财报、政策文件、分析PE估值,政务行业大模型会帮助撰写公文、建筑行业大模型会帮助做建筑规划,它们就像行业里的“行业智能助手”,用专业知识帮人干活。比如医疗大模型,金融大模型。

以政务行业大模型为例,具体如下图:

4、场景级大模型的通俗解释的应用场景

场景级大模型是在基础级大模型、行业级大模型基础上,结合具体业务场景和数据,经过模型微调而构建的,专注于解决具体业务场景问题。场景级大模型不追求“全能”,但能在特定任务中做到精准高效,参数规模通常相对较小,适合部署在本地化,大多数情况下是与应用系统、终端设备等结合使用。

比如某医院的”CT影像辅助诊断系统”,就属于医疗行业级大模型下的细分场景应用。

除此之外,我们日常接触到的手机相册的”宠物识别”功能、快递柜自动读取取件码、商场导航机器人对话系统、工厂用的”工业质检大模型”、农业用的”病虫害识别大模型”、法律用的”合同审查大模型”、政务行业用的“公文排版”等都可以划分为场景级大模型范畴。

5、基础级、行业级、场景级大模型三者之间的关系

可以将三者理解为层层递进的”知识加工链”,如果把人工智能大模型比作一座金字塔,基础级大模型是地基,行业级是中层结构,场景级就是顶部的尖塔,它们各司其职又相互支撑,共同构建起智能化的未来世界。

基础级提供通用能力:好比面粉,能做成馒头也能做蛋糕胚。

行业级注入专业知识:像在面粉里加入可可粉,变成巧克力专用原料。

场景级塑造最终形态:用巧克力原料做成生日蛋糕上的装饰玫瑰花。

例如,某大型企业有一个典型的应用场景,先用基础级视觉大模型识别设备外观,叠加化工行业大模型判断反应釜温度异常,最终通过设备故障预测场景模型给出维修方案。

理解这三者的区别,可以帮助我们更好地使用大模型,让AI赋能我们生活、工作的方方面面,比如,需要通用咨询找基础级,解决专业问题选行业级,完成具体任务用场景级。

当它们协同工作时,才是人工智能真正的魅力所在。

以上就是本期要讲的内容,感谢大家的持续关注与支持,下期更精彩,敬请期待。

点击扫码分享至微信