盘古大模型

华为推出的千亿参数多模态大语言模型

一句话定位

盘古大模型是华为推出的千亿参数多模态大语言模型,分为基础大模型、行业大模型多层架构。

核心价值

  • 华为官方自研大模型,技术积累深厚
  • 三层架构:L0基础大模型、L1行业大模型、L2场景模型
  • 已开源 7B 稠密模型和 72B MoE 混合专家模型
  • 支持NLP、CV、科学计算等多个领域

模型系列

  • 盘古NLP大模型:自然语言处理,兼顾理解和生成能力
  • 盘古CV大模型:计算机视觉,检测分割生成全能
  • 行业大模型:矿山、药物分子、气象、海浪等垂直领域
  • 盘古5.0:全系列升级,全模态、强思维能力提升

功能亮点

  • 小样本学习能力出色,下游适配快
  • 支持千亿参数规模,推理能力强
  • 开源开放,研究者可以免费使用
  • 适配华为昇腾AI算力,优化推理性能

适用人群

  • AI研究者和大模型开发者
  • 企业需要行业定制大模型
  • 寻找国产开源大模型的用户
  • 华为昇腾生态用户

综合说明

盘古大模型是华为研发的国产大语言模型,从2021年发布至今已经迭代到5.0版本。项目在GitHub开源,开发者可以下载使用。盘古大模型创新性地提出了层次化架构,从基础大模型到行业大模型再到场景模型,方便不同行业快速适配落地,是国产大模型的重要代表项目。