摘要: Google的新声音操作的AI助手称为Astra,可以理解手机的相机所看到的。在Openai透露了对Chatgpt的类似愿景之后的一天,宣布了这一点。
Google发布下一代AI助手Project Astra
Google在今天的I/O开发者大会上推出了一款名为Project Astra的“下一代AI助手”。这一新概念实现了Hassabis去年12月首次介绍Gemini潜力时的承诺。
Project Astra能够通过口头命令理解设备摄像头所看到的物体和场景,并用自然语言进行对话。它可以识别计算机音箱并回答有关其组件的问题,识别伦敦的街区,阅读和分析计算机屏幕上的代码,创作关于铅笔的打油诗,以及回忆一个人放下眼镜的地方。
Google的Project Astra使用了Gemini Ultra的先进版本,这是一个旨在与自2023年3月以来一直驱动CHAT GPT的AI模型竞争的AI模型。Gemini和OpenAI的GPT-4o一样,是“多模态”的,意味着它已经接受了音频、图像和视频的训练,以及文本,并且可以在所有这些格式中原生地摄取、混合和生成数据。Google和OpenAI转向这项技术代表了生成式AI的一个新时代;迄今为止,给世界带来CHAT GPT及其竞争对手的突破来自纯文本工作的AI模型,必须与其他系统结合以添加图像或音频功能。
Hassabis在今天活动之前的一次采访中表示,他认为仅限于文本的聊天机器人将被证明只是通往更复杂、希望更有用的AI助手的“过渡阶段”。“这一直是Gemini背后的愿景,”Hassabis补充说。“这就是为什么我们使它成为多模态的。”
看、听和说的Gemini和CHAT GPT的新版本展示了令人印象深刻的演示,但它们在工作场所或个人生活中将发挥什么作用尚不清楚。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...