六彩天下网

国产中文大语言模型“天河天元”发布

作者:it之家 来源:it之家 发布时间:2023-05-22 15:54:01

IT之家 5 月 21 日消息,5 月 18 日,2023 第七届世界智能大会于国家会展中心(天津)正式开始,大会智能科技展期为期四天。

此次智能科技展统筹规划了 8 大展馆和室外展区,设置了信息技术应用创新、人工智能、5G + 工业互联网、智能交通、智能制造、智慧生活、数字金融、数字健康、国际与省市等主题展示区,以及智能驾驶、5G 两大体验专区。

天河新一代超级计算机是中国新一代百亿亿次超级计算机,也在此次展会迎来首次亮相。多年来,天河超级计算机从千万亿次到百亿亿次(IT之家注:新一代超级计算机非天河一号,其系统双精度浮点峰值计算性能达 200P Flops、数据存储能力不低于 20PB、峰值功耗不高于 8 兆瓦,比“天河一号”算力提高了 150 倍),不断挑战世界算力速度极限,而天津依托天河占据了全国超过 20% 的超级计算算力资源。

为充分发挥超算在算力方面的优势,推动国产异构超级计算机平台在 AI 应用开发和服务领域中的应用,国家超算天津中心在第七届世界智能大会期间举行的世界智能科技创新合作峰会上发布了“天河 E 级智能计算开放创新平台”和“天河天元大模型”。

六彩天下网

▲ 图源:国家超算天津中心

据介绍,中文大语言模型的数据集非常稀缺。国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据,以及专业领域的中医、医药、问诊、法律等多种数据集,训练数据集总 token 数达到 350B,最终训练打造出了自己的中文语言大模型 —— 天河天元大模型。

六彩天下网

天河新一代超级计算机实现了从硬件到软件环境全面自主的信息技术应用创新,官方也在展区展示了天河新一代超级计算机上采用的计算芯片、主板等核心技术。

据悉,“天河 E 级智能计算开放创新平台”将带来突破百亿亿次的跨模态的超级计算算力,支撑传统的科学工程计算,并服务智能混合计算,打造全方位的算力赋能创新和数字经济高质量发展载体。

六彩天下网

未来,国家超算天津中心还将在“天河天元大模型”的基础上启动深度训练面向医疗、工业、法律等领域的专业模型。未来大模型将在深度学习平台的支撑下成为产业智能化基座。

原文地址:https://www.ithome.com/0/694/018.htm