一句话定位
盘古大模型是华为推出的千亿参数多模态大语言模型,分为基础大模型、行业大模型多层架构。
核心价值
- 华为官方自研大模型,技术积累深厚
- 三层架构:L0基础大模型、L1行业大模型、L2场景模型
- 已开源 7B 稠密模型和 72B MoE 混合专家模型
- 支持NLP、CV、科学计算等多个领域
模型系列
- 盘古NLP大模型:自然语言处理,兼顾理解和生成能力
- 盘古CV大模型:计算机视觉,检测分割生成全能
- 行业大模型:矿山、药物分子、气象、海浪等垂直领域
- 盘古5.0:全系列升级,全模态、强思维能力提升
功能亮点
- 小样本学习能力出色,下游适配快
- 支持千亿参数规模,推理能力强
- 开源开放,研究者可以免费使用
- 适配华为昇腾AI算力,优化推理性能
适用人群
- AI研究者和大模型开发者
- 企业需要行业定制大模型
- 寻找国产开源大模型的用户
- 华为昇腾生态用户
综合说明
盘古大模型是华为研发的国产大语言模型,从2021年发布至今已经迭代到5.0版本。项目在GitHub开源,开发者可以下载使用。盘古大模型创新性地提出了层次化架构,从基础大模型到行业大模型再到场景模型,方便不同行业快速适配落地,是国产大模型的重要代表项目。