Stack Overflow与Google合作,为AI项目提供数据支持

摘要: Stack Overflow的编程社区将为Google的Gemini Chatbot提供动力。它是与寻求削减生成AI繁荣的网站的新型AI数据许可交易的一部分。

Stack Overflow与Google合作,为AI项目提供数据支持

Stack Overflow与Google合作,为AI项目提供数据支持

去年,Stack Overflow宣布将向AI巨头收费,以提供用于训练聊天机器人的内容,成为第一批做出此举的网站之一。现在,这家为程序员提供问答服务的网站已经签约首位客户——Google。Stack Overflow的首席执行官Prashanth Chandrasekar表示,这标志着一项“有意义”的新收入来源的开始。

这项交易意义重大,因为目前尚不清楚Google和其他AI开发者是否会为AI项目所需的内容付费。数百万本书籍和网站推动了AI系统的发展,但大多数出版商并未得到补偿,一些出版商因所谓的滥用而提起诉讼。许多出版商,包括Stack Overflow,在CHAT GPT等生成式AI产品的威胁下显得不安,这些产品可以回答以往可能会让程序员忙碌的查询。

这项交易将使Google的云计算部门利用Stack Overflow关于Google Cloud服务的问题和答案,通过Google的Gemini聊天机器人的一个版本提供编码帮助和技术支持。Google的云计算客户也可以通过Google Cloud的命令行界面提出问题。Chandrasekar表示:“他们的AI可能无法回答所有问题,因此我们有很大的能力帮助完成这个循环。我们是社区知识被筛选和验证的最大场所。”

Gemini将用自己的话总结从Stack Overflow获取的答案,但会包含公司的标志、指回原始材料的链接以及提供答案的网站贡献者的用户名。这两家公司计划在谷歌云Next活动上展示该系统,该活动是该搜索公司每年的云计算会议,并计划在活动之后不久推出该系统。

Chandrasekar表示,Google Cloud在使用Stack Overflow数据方面没有太多限制,这意味着可以用于训练大型语言模型和其他AI系统。他表示:“我们想要坚定的是——对我们来说是不可商议的事情——信任、准确性、质量,并将这些AI输出的来源归因回去。”

他拒绝透露Google向Stack Overflow支付了多少数据。“这对我们来说在短期、中期和长期都将是一个有意义的商业提供,”Chandrasekar说。

Google和其他AI开发者以前曾在没有引起太多注意的情况下从Stack Overflow和其他网站收集数据。随着对生成式AI技术的需求激增,以及开发这些技术的公司估值的飙升,提供基础文本的网站已经开始要求他们认为应得的份额。幸运的是,潜在客户已经听到了这个信息,Chandrasekar表示:“我们不需要去追逐人们。”

Stack Overflow的数据对生成计算机代码的AI系统特别有益,这些系统已被证明受到软件工程师的欢迎,并为微软和OpenAI带来了可观的收入。

这项新的Stack Overflow交易发生在谷歌与Reddit达成许可协议的一周之后,后者是讨论论坛运营商,其内容有助于聊天机器人进行对话。Reddit在Stack Overflow去年宣布之前已经公布了开始收费获取数据的计划。

© 版权声明

相关文章

暂无评论

暂无评论...