摘要: Startup Databricks刚刚发布了DBRX,DBRX是迄今为止最强大的开源大型语言模型,它是元来挖掘Meta的Llama 2。
数据科学与人工智能公司Databricks发布顶尖AI语言模型DBRX
上周一,大约十几名Databricks的工程师和高管们通过Zoom连线的会议室聚集在一起,期待着他们是否成功构建了一款顶尖人工智能语言模型。经过数月的努力和约1000万美元的投入,他们培训了一个名为DBRX的大型语言模型,类似于OpenAI的CHAT GPT。但直到最终测试结果出来,他们才能知道他们的创造物有多强大。
“我们超越了一切。”Databricks的首席神经网络架构师Jonathan Frankle最终告诉团队,团队欢呼雀跃,发送掌声表情符号。Frankle通常不碰咖啡因,但在熬夜写出结果报告后,他喝着冰拿铁。
Databricks将以开源许可证发布DBRX,让其他人在其基础上构建。Frankle分享的数据显示,在约十几个基准测试中,衡量AI模型回答常识问题的能力、进行阅读理解、解决棘手的逻辑难题以及生成高质量代码方面,DBRX优于所有其他可用的开源模型。
令人惊讶的是,DBRX在几个方面也与OpenAI的CHAT GPT所使用的GPT-4模型惊人接近。Frankle带着超级大的笑容说:“我们为开源大型语言模型设立了新的技术标准。”
通过开源DBRX,Databricks正在推动一个挑战当前生成式人工智能领域最知名公司保密做法的运动。OpenAI和Google保密其GPT-4和Gemini大型语言模型的代码,但一些竞争对手,特别是Meta,已经发布了他们的模型供他人使用,认为这将通过让更多的研究人员、企业家、初创企业和已建立的企业使用技术来推动创新。
Databricks表示,他们还希望公开有关创建其开源模型的工作,这是Meta没有就其Llama 2模型创建的一些关键细节公开的。该公司将发布一篇博客文章详细介绍创建模型所涉及的工作,并邀请WIRED在Databricks工程师在培训DBRX的数百万美元过程的最后阶段做出关键决策时花时间。这提供了一个窥视构建领先AI模型的复杂和具有挑战性的过程,但也展示了该领域最近的创新如何降低成本。结合DBRX等开源模型的可用性,这表明AI的发展不会很快放缓。
AI研究所Allen Institute for AI的首席执行官Ali Farhadi表示,急需更多关于构建和训练AI模型的透明度。由于公司竞相寻求优势,近年来该领域变得越来越保密。当人们担心先进AI模型可能带来的风险时,保密尤为重要。Farhadi表示:“看到任何开放性的努力我都感到非常高兴。”他说:“我相信市场的重要部分将转向开放模型。我们需要更多这样的举措。”