Google发布下一代AI助手Project Astra

4.1K 0 0

摘要: Google的新声音操作的AI助手称为Astra，可以理解手机的相机所看到的。在Openai透露了对Chatgpt的类似愿景之后的一天，宣布了这一点。

Google发布下一代AI助手Project Astra

Google在今天的I/O开发者大会上推出了一款名为Project Astra的“下一代AI助手”。这一新概念实现了Hassabis去年12月首次介绍Gemini潜力时的承诺。

Project Astra能够通过口头命令理解设备摄像头所看到的物体和场景，并用自然语言进行对话。它可以识别计算机音箱并回答有关其组件的问题，识别伦敦的街区，阅读和分析计算机屏幕上的代码，创作关于铅笔的打油诗，以及回忆一个人放下眼镜的地方。

Google的Project Astra使用了Gemini Ultra的先进版本，这是一个旨在与自2023年3月以来一直驱动CHAT GPT的AI模型竞争的AI模型。Gemini和OpenAI的GPT-4o一样，是“多模态”的，意味着它已经接受了音频、图像和视频的训练，以及文本，并且可以在所有这些格式中原生地摄取、混合和生成数据。Google和OpenAI转向这项技术代表了生成式AI的一个新时代；迄今为止，给世界带来CHAT GPT及其竞争对手的突破来自纯文本工作的AI模型，必须与其他系统结合以添加图像或音频功能。

Hassabis在今天活动之前的一次采访中表示，他认为仅限于文本的聊天机器人将被证明只是通往更复杂、希望更有用的AI助手的“过渡阶段”。“这一直是Gemini背后的愿景，”Hassabis补充说。“这就是为什么我们使它成为多模态的。”

看、听和说的Gemini和CHAT GPT的新版本展示了令人印象深刻的演示，但它们在工作场所或个人生活中将发挥什么作用尚不清楚。