盘古大模型3.0发布华为云CEO张平安：盘古大模型不会写诗，只会做事世界视讯

(相关资料图)

当前，国内大模型进展不断。7月7日，在华为开发者大会2023（Cloud）上，华为常务董事、华为云CEO张平安发布了盘古大模型3.0。据他介绍，盘古大模型3.0是一个面向行业的大模型系列，包括“5+N+X”三层架构。

传统的AI开发模式下，一个场景对应一个模型，数据质量差、样本少，模型精度差，并且应用场景相对单一。不同行业、不同场景对AI的需求既复杂且碎片化，每个痛点都需要进行定制化地开发和改造；另一方面，AI算法从理论上能够极大提升产品及服务的价值量，但由于开发过程中存在大量的碎片化因素，不同的应用场景往往需要独立的架构设计与调参，效率相对较低。“小作坊式”的AI开发模式在一定程度上限制了生产力。

从华为盘古大模型的进化路径可以看出，主要分为L0、L1、L2三个阶段。L0指基础大模型，L1是在L0基础上导入行业数据进行训练后衍生出的行业大模型，L2是在L1基础上结合行业细分场景得到的推理模型，上层是在下层的基础上演化而来，层层递进。国金证券认为，华为盘古大模型是一种工业化AI开发的新模式，可以解决小模型的定制化难题，使一个模型应用到多个场景中。

具体来看，其中，L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型，包括NLP（自然语言处理）大模型的知识问答、文案生成、代码生成，以及多模态大模型的图像生成、图像理解等能力。

L1层是指N个行业大模型，华为云既可以提供使用行业公开数据训练的行业通用大模型，包括政务、金融、制造、矿山、气象等大模型；也可以基于行业客户的自有数据，在盘古大模型的L0和L1层上，为客户训练自己的专有大模型。L2层则提供面向各行业中更细化场景的模型，如先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景等。

公开资料显示，华为盘古大模型于2020年启动研发。2021年4月，华为发布了NLP大模型、视觉大模型和科学计算大模型。此后，盘古大模型在性能、深度、架构方面及数据增强方面持续升级。当前，盘古大模型的核心定位是为各行各业赋能。

会上，张平安分别介绍了盘古大模型在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥的价值。

例如，在煤矿领域，盘古矿山大模型已经在全国8个矿井规模使用，一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景，让更多的煤矿工人能够在地面上作业，减少安全事故；在气象领域，原来预测一个台风未来10天的路径，需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型，10秒内就可以获得更精确的预测结果。

张平安表示，华为的盘古大模型不会写诗，只会做事。它要帮助各行各业，在各个领域都要让AI来赋予它们价值。比如金融、矿山、政务，有很多工作小组都派下去。“我们一直坚持的方向就是‘AI for Industries’”

（文章来源：每日经济新闻）