微软大模型WizardMath开源

2023-08-20

8 查看

收藏已收藏已移除 0

据量子位报道，微软于8月11日公布其最新开源大模型WizardMath。经过GSM8k数据集测试，在参数只有700亿，远不及后三者的情况下，WizardMath数学能力直接击败了ChatGPT、Claude Instant 1、PaLM 2-540B等一众大模型。目前，其相关代码、复现方式及论文都已开源或上线，于GitHub上已揽获4.8k标星。

作者开发了一种新的方法Evol Instruction，利用AI来代替人类自动生成涵盖各种难度级别开放域指令，然后利用该方法生成很多数学领域相关的指令，以此对羊驼大模型进行微调，得到了WizardMath。

以此类推，作者还在羊驼之上得到了专攻代码能力的WizardCoder，效果超越Claude和Bard。

论文共9位作者，均为华人。通讯作者为姜大昕，微软全球合伙人、副总裁、前微软亚洲研究院首席科学家，在微软工作16年有余、曾作为微软必应搜索引擎和Cortana智能助手自然语言理解负责人，日前已被曝离职投身大模型创业。

项目主页：
https://github.com/nlpxucan/WizardLM/tree/main/WizardMath

论文地址：
https://arxiv.org/abs/2304.12244（WizardLM）
https://arxiv.org/abs/2306.08568（WizardCoder）

微软大模型WizardMath开源

Meeting the Shadow: The Hidden Power of the Dark Side of Human Nature - GOOD

Runway Gen-2更新，可生成18秒视频

iPhone 16 Pro Max和华为 Mate XT选择哪个比较好？

iFixit：苹果 iPhone 16 是史上最容易维修的 iPhone

英特尔研发全新X86架构

华为HarmonyOS NEXT正式版将于9月底发布

接收有关新品上线的信息、提示和优惠通知

联系信息

探索...

2024 年最畅销的 WordPress 主题

iPhone 16 Pro Max和华为 Mate XT选择哪个比较好？

对比商品

购物车