2024-05-08 02:41

微软推新模型MAI-1,5000亿参数挑战OpenAI

文章来源:头部科技

文丨海天


图片来源:由无界AI生成
图片来源:由无界AI生成



微软似乎对开发新AI模型极为痴迷,接二连三发布新作品。 2023年6月微软发布Phi-1,12月又更新至Phi-2,到了今年4月,它又发布拥有38亿参数的Phi-3。

按照微软的介绍,Phi-3追求“小而美”,可以在智能手机、笔记本电脑上运行。



最近又有消息称微软正在开发MAI-1模型,它与Phi-3完全背道而驰,拥有5000亿参数,是微软至今为止最大的模型。


虽然我们现在还不知道MAI-1有什么卖点,也不知道微软想通过它达成怎样的目标,但有一点是可以肯定的:微软希望凭借MAI-1巩固AI霸主地位。


MAI-1意味着微软与OpenAI的竞争开始升级

微软MAI-1还没有正式发布,目前仍处在开发阶段,所以很多细节我们无从知晓。考虑到MAI-1是超大模型,它瞄准的对手无疑是谷歌、OpenAI。虽然微软是OpenAI的早期投资者,但二者也存在竞争关系。


对于微软来说,训练MAI-1有优势,因为它拥有海量数据。为什么微软要从零开始开发全新模型MAI-1呢?可能微软不想将全部赌注押在OpenAI身上,也可能是想摆脱垄断嫌疑,让美国监管机构放心。


MAI-1拥有5000亿参数,比很多其它大模型都要庞大,例如,Meta开发的Llama 2模型只有700亿参数。尽管MAI-1是微软至今为止最大的模型,但还是比不过OpenAI GPT-4,后者据说有1万亿参数。


微软拥有庞大的数据资源和算力,它还采购大量英伟达GPU,组建服务器集群,完全有实力训练规模庞大的模型。未来微软肯定会继续加大算力投入,训练更大的模型。


2019年微软首席技术官Kevin Scott曾在邮件中告诫员工,相比谷歌和OpenAI,微软在AI领域进步缓慢。暗中开发MAI-1意味着微软想挑战行业领导者,降低对OpenAI的依赖,实现AI产品多样化,未来微软与谷歌、OpenAI的竞争将会升级。


由行业大佬操刀 性能值得期待


帮助微软开发MAI-1的大佬叫Mustafa Suleyman,他曾是AI创业公司Inflection的CEO。不久前微软斥资6.5亿美元收购Inflection,Mustafa Suleyman顺理成章成为微软员工。


虽然MAI-1是Mustafa Suleyman领导开发的,但它并没有采用Inflection模型,而是微软重新打造的。微软有可能借用了Inflection的数据和技术,但并没有将Inflection模型拿过来直接更换皮肤然后使用。


Mustafa Suleyman在创建Inflection之前曾在谷歌AI部门工作,所以他在美国AI领域名声远扬。在谷歌工作时,Mustafa Suleyman创建了谷歌DeepMind AI实验室,实际上他为微软工作才一个月,我们有理由相信微软团队才是MAI-1的真正“作者”,只是现在工作交到Mustafa Suleyman手中,由他接管。


5月7日Mustafa Suleyman在推特上发消息称微软从上到下拥有强大文化,这在如此规模庞大的企业中实属罕见。他还强调微软是一家“真正的AI优先企业”,推动着技术实现大变革。


3月份Mustafa Suleyman加盟微软时微软CEO Satya Nadella曾野心勃勃表示,要以安全、负责任态度让AI服务于地球上的每一个人和每一个组织。言语之中不难看出Satya Nadella对Mustafa Suleyman有着超高期待。


Mustafa Suleyman对AI有着自己的独家见解,他认为AI本质上就是“劳力替代工具”,他极为看重责任感,要求AI开发向社会负责,这一主张与Satya Nadella的理念是吻合的。


微软目前正在重点打造Copilot,Mustafa Suleyman认为它是真正具有变革性的AI工具,前途不可限量,希望能为Copilot进化贡献自己的智慧。

真能与GPT-4抗衡吗?恐怕很难


正如之前所说的,MAI-1的参数为5000亿,而GPT-4达到万亿,明显GPT-4有优势。不论是原始处理能力还是应对复杂任务的能力,MAI-1都比不过GPT-4。


2020年年中时OpenAI推出GPT-3,它拥有1750亿参数;到了GPT-4,参数膨胀至1万亿。1万亿只是外界猜测的数据,OpenAI并没有确认。有人甚至认为OpenAI旗舰LLM拥有1.76万亿参数,谷歌Gemini Ultra拥有1.6万亿参数。Gemini Ultra对标的也是GPT-4。


如果单看参数,MAI-1远不及GPT-4和Gemini Ultra,考虑到微软拥有庞大的数据资源和超强计算基础设施,差距应该能缩小一些,但不太可能超越GPT-4。


在比较时我们也不能光看参数,还要关注大模型的功能和性能。两款大模型都能执行多种任务,比如自然语言处理、代码生成。无论是用学术指标还是职业标准衡量,GPT-4都很出色,已经得到认可,MAI-1还没有正式发布,也没有接受评测,所以它的性能如何我们还无法给出结论。


唯一的线索来自Mustafa Suleyman,他暗示MAI-1非常强大,至于是不是夸大,夸大了多少,还要让时间来回答。不用等很久,有消息称MAI-1最快可能本月就会发布。


MAI-1和GPT-4并不是毫无关系的两个产品,二者也有一定联系。例如,微软训练MAI-1时借用了GPT-4生成的文本。


5月16日微软将会召开Build开发者大会,业界普遍认为如果性能达到预期,微软会在大会上发布MAI-1。如果真是这样,微软可能已经拥有原型MAI-1产品,如果没有,那么未来几周必然准备好原型。

本文链接:https://www.aixinzhijie.com/article/6845696
转载请注明文章出处

评论
登录 账号发表你的看法,还没有账号?立即免费 注册
下载
分享
收藏
阅读
评论
点赞
上一篇
下一篇