您的位置:财经 >

微软和NVIDIA今天宣布了由DeepSpeed和威震天驱动的威震天—图灵自然语言生成模型

2021-10-13 18:41:12 来源:IT之家阅读量:19539   

语言模型简单来说就是一串单词的概率分布,它的主要功能是为长度为m的文本确定一个概率分布p,表示这个文本存在的可能性。

你可能之前或多或少听过OpenAI最新的语言模型GPT—3,它被称为表面上最强的语言模型,也被视为革命性的人工智能模型除此之外,还有一些重量级产品如BERT,Switch Transformer等,行业内其他企业也在尝试推出自己的车型

微软和NVIDIA今天宣布了由DeepSpeed和威震天驱动的威震天—图灵自然语言生成模型,这是迄今为止训练出来的最大,最强大的解码语言模型。

IT之家了解到,作为图灵NLG 17B和威震天—LM的继承者,这个模型包含了5300亿个参数,MT—NLG的参数数量是GPT—3的3倍,是同类中现存最大的模型,在:等一系列广泛的自然语言任务中表现出无与伦比的准确性。

完整的预测。

阅读理解

常识推理

自然语言推理

词义消歧

基于105层转换器的MT—NLG在零样本,单样本和少样本的设置上改进了最先进的模型,并为两个模型的大规模语言模型设定了新的标准和质量。

根据消息显示,模型训练是在基于NVIDIA DGX superpad的塞勒涅超级计算机上混合精度完成的,该超级计算机由560台DGX A100服务器支持,与HDR InfiniBand以完整的胖树配置连接每台DGX A100都有8个NVIDIA a100 80gb tensorcore GPUs,它们通过NVLink和NVSwitch完全连接在一起微软Azure NDv4云超级计算机采用了类似的参考架构

更多信息请参考微软和NVIDIA官方说明:

微软

显卡

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

相关推荐
崂山区科创委联合沙子口街道、大石社区启动农民水彩画展

崂山区科创委联合沙子口街道、大石社区启动农民水彩画展

9月6日上午,在崂山区政府西塔楼一楼大厅,崂山区科创委联合沙子口街道、大石社区启动了为期5天的大石村农民水彩画展。本次画

2021-09-08 12:23
“95后”女孩5米高空开“天车”

“95后”女孩5米高空开“天车”

在5米高空作业,将数吨重的火车车轮或者小到几十斤的ldquo;铁疙瘩rdquo;安全装卸到位,可能谁也不会把这一切和一个

2021-09-03 11:10
做孩子心中的光

做孩子心中的光

每个孩子都有其独特的成长规律。在孩子成长的过程中,每一步都充满着对这个世界的好奇,那作为家长的我们,该如何顺应孩子的成长

2021-08-30 18:50
独家冠名2021第五届中国家居品牌大会国美打扮家有何独特之处?

独家冠名2021第五届中国家居品牌大会国美打扮家有何独特之处?

2021年7月19日,备受关注的2021第五届中国家居品牌大会在广州启幕,现场发布2020-2021中国家居十大优选品牌

2021-07-26 01:28
精彩推荐
头条关注
热点新闻