微软大模型WizardMath开源

据量子位报道,微软于8月11日公布其最新开源大模型WizardMath。经过GSM8k数据集测试,在参数只有700亿,远不及后三者的情况下,WizardMath数学能力直接击败了ChatGPT、Claude Instant 1、PaLM 2-540B等一众大模型。目前,其相关代码、复现方式及论文都已开源或上线,于GitHub上已揽获4.8k标星。

作者开发了一种新的方法Evol Instruction,利用AI来代替人类自动生成涵盖各种难度级别开放域指令,然后利用该方法生成很多数学领域相关的指令,以此对羊驼大模型进行微调,得到了WizardMath。

以此类推,作者还在羊驼之上得到了专攻代码能力的WizardCoder,效果超越Claude和Bard。

论文共9位作者,均为华人。通讯作者为姜大昕,微软全球合伙人、副总裁、前微软亚洲研究院首席科学家,在微软工作16年有余、曾作为微软必应搜索引擎和Cortana智能助手自然语言理解负责人,日前已被曝离职投身大模型创业。

项目主页:
https://github.com/nlpxucan/WizardLM/tree/main/WizardMath

论文地址:
https://arxiv.org/abs/2304.12244(WizardLM)
https://arxiv.org/abs/2306.08568(WizardCoder)

商匡云商
Logo
注册新帐户
对比商品
  • 合计 (0)
对比
0
购物车