全球首个知识增强千亿大模型亮相——鹏城—百度·文心

12月8日,鹏城实验室与百度联合发布全球首个知识增强千亿大模型——鹏城—百度·文心。

为什么大模型在产学界持续走热,越来越多的技术公司入场?

如中国工程院院士、鹏城实验室主任高文所言,预训练模型赋能人工智能衍生更多的应用,而不局限于某个领域,是人工智能自身发展并作用于社会及科学创新的重要工具。

当人工智能的需求呈现出碎片化、多样化的特点,人工智能模型却存在很多挑战,通用低是首要问题。也就是说,A模型往往专用于特定A领域,应用到B领域便差强人意。

百度首席技术官王海峰介绍,鹏城—百度·文心是全球首个知识增强千亿大模型,参数规模达2600亿。在机器阅读理解、文本分类、语义相似度计算等60多项任务上取得最好效果,并在30余项小样本和零样本任务上刷新基准。

百度集团副总裁、深度学技术及应用国家工程实验室副主任吴甜说:“60多项不同的任务,说明大模型的通用很强,30余项小样本和零样本任务刷新基准,则意味着大模型泛化能力更强,对支撑各行各业非常重要。”

鹏城—百度·文心希望解决传统人工智能模型泛化差、强依赖昂贵人工标注数据、落地成本高等应用问题,希望成为千行百业人工智能开发的首选基座大模型。

而鹏城实验室的算力系统“鹏城云脑Ⅱ”和飞桨深度学台就是鹏城—百度·文心理想实现的关键支撑,解决了超大模型训练的多个公认技术难题。

作为产业级知识增强大模型,文心包含自然语言理解大模型、计算机视觉大模型和跨模态大模型,既指向基础通用的,也面向重点领域和重点任务,还有丰富的工具与台。“知识增强”是它的核心特色。

知识是人类智慧的结晶,是人类进步的重要推动力。通过知识增强,计算机有了学并运用知识,像人一样理解和认知世界的可能。

吴甜强调:“我们希望人工智能系统通过对知识的学,能够提升学效率,具有更好的可解释,更符合人对事物的理解。”

文心大模型正通过百度飞桨台陆续对外开源开放,已大规模应用于百度搜索、信息流、智能音箱等互联网产品,并赋能工业、能源、金融、通信、媒体、教育等各行业。

(记者 刘 艳)

来源:科技日报
编辑:GY653

免责声明:本网站内容主要来自原创、合作媒体供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

  • 相关推荐