Azure OpenAI 服务随着 GPT-4 Turbo with Vision 的正式发布而扩展

Microsoft 已正式向所有 Azure OpenAI 服务客户提供 GPT-4 Turbo with Vision，这标志着在将高级 AI 模型集成到业务流程方面向前迈出了一步。正如该公司最近的一篇博客文章中所详述的那样，这一发展允许瑞典中部和美国东部 2 个 Azure OpenAI 区域的客户部署“gpt-4-turbo-2024-04-09”模型。该模型旨在通过利用人工智能的力量以统一的方式理解和解释图像和文本来增强业务运营。该版本是在去年 12 月预览版集成之后发布的。

应用和特点

GPT-4 Turbo with Vision 的部署已经在各个领域得到了广泛的应用。零售商正在使用该模型来改善在线购物体验，而媒体和娱乐公司正在利用它来更有效地管理数字资产。此外，该模型还帮助各种组织从图表和图表中提取见解，展示了其在处理视觉信息方面的多功能性。尽管公共预览版中缺少某些功能，例如光学字符识别（OCR）、对象接地、视频提示和特定的图像数据处理功能，但 Microsoft 致力于在将来的更新中集成这些功能。即将推出的“JSON模式和函数调用涉及图像（视觉）输入的推理请求”有望进一步增强模型的实用性。

GPT-4V 引入了几个旨在简化开发过程的关键功能。值得注意的是，它支持 JSON 模式和函数调用，便于与现有代码库集成。该模型在其前身 GPT-4 Turbo 的上下文窗口中保留了令人印象深刻的 128,000 个代币，允许在单个请求中进行广泛的数据处理。开发人员现在可以通过直接链接或传递 base64 编码图像来输入图像，从而扩展模型在各种应用程序中的实用性。