智云网 智云网
首页 /  热文 /  内容

华为“盘古 Chat”会不会面向C端用户开放

热文 2023-06-04 16:51:54

华为“盘古 Chat”大模型产品主要面向To B/G政企端客户

华为公司将发布一款名为“盘古 Chat”的多模态千亿级大模型产品,该产品主要面向To B/G政企端客户。据钛媒体报道,华为盘古大模型于2020年11月在华为云内部立项成功。盘古大模型定位于模型要大,可以吸收海量数据;网络结构要强,能够真正发挥出模型的性能;要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。根据华为公布的一份论文数据显示,华为盘古PanGu-Σ大模型参数最多为1.085万亿,基于华为自研的MindSpore框架开发。整体来看,PanGu-Σ大模型在对话方面可能已接近GPT-3.5的水平。

盘古大模型是首个干亿参数中文预训练大模型,CV大模型则首次达到30亿参数。浙商证券此前披露的信息显示,华为在训练千亿参数的盘古大模型时调用了超过2000块的昇腾910芯片,进行了超2个月的数据训练能力。华为内部称,每年大模型训练调用GPU/TPU卡超过4000片,3年的大模型算力成本高达9.6亿元人民币。

盘古大模型分别为:NLP大模型、CV大模型、多模态大模型、科学计算大模型。其中,盘古NLP大模型首次使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。盘古CV大模型是首次实现模型按需抽取的业界最大CV大模型,首次实现兼顾判别与生成能力,基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地。盘古气象大模型提供秒级天气预报,借助创新的3DEST网络结构以及分层时间聚合算法,在气象预报的关键要素和常用时间范围上精度均超过当前最先进的预报方法,速度相比传统方法提升1000倍以上。

华为盘古大模型的优势在于人才储备和算力自主可控,有望成为国内领先的大模型,其生态产业链标的有望迎来加速发展,包括拓维信息、四川长虹、麒麟软件(中国软件)、统信软件(诚迈科技)、麒麟信安等华为生态公司。

版权申明:文章由用户发布,不代表本网站立场,如果侵权请联系我们删除。