摘要: OpenAI宣布,现在通常可以通过公司的API获得其功能强大的GPT-4涡轮增压模型,为企业和开发人员提供了将高级语言和视觉功能集成到其应用程序中的新机会。
OpenAI发布强大的GPT-4 Turbo with Vision模型
OpenAI宣布其强大的GPT-4 Turbo with Vision模型现已通过公司的API全面推出,为企业和开发人员提供了整合先进语言和视觉功能到其应用程序中的新机会。
GPT-4 Turbo with Vision的API推出是在去年9月首次发布GPT-4的视觉和音频上传功能以及在11月OpenAI开发者大会上推出经过增强的GPT-4 Turbo模型之后。
GPT-4 Turbo承诺显著的速度提升,输入上下文窗口扩大至128,000个标记(相当于约300页),并且对开发人员更加实惠。
一个关键的增强功能是API请求可以利用该模型的视觉识别和分析功能通过文本格式JSON和函数调用。这使得开发人员可以生成可以在连接的应用程序内自动执行操作的JSON代码片段,例如发送电子邮件、进行购买或发布在线内容。然而,OpenAI强烈建议在执行影响现实世界的操作之前建立用户确认流程。
一些初创公司已经开始利用GPT-4 Turbo with Vision,包括AI编码代理Devin依赖该模型自动生成完整代码的Cognition:
Healthify,一款健康和健身应用程序,利用该模型根据餐食照片提供营养分析和建议:
TLDraw,一家总部位于英国的初创公司,利用GPT-4 Turbo with Vision来驱动其虚拟白板,并将用户的绘画转换为功能性网站:
尽管面临Anthropic的Claude 3 Opus和Google的Gemini Advanced等新模型的激烈竞争,但API的推出应有助于巩固OpenAI在企业市场中的地位,开发人员正在等待公司的下一个大型语言模型。
(照片由v2osk)