OpenAI新开放了这些好用的API功能

如题所述

OpenAI最近在开发者大会上展示了其一系列API功能更新,包括增强的GPT-4 Turbo、视觉能力、DALL·E 3和文本转语音技术等,面向Plus账户用户开放。以下是这些API功能的详细介绍:


视觉理解


GPT-4 Turbo版本引入了视觉能力,模型可以处理图像,回答关于图像内容的问题。它擅长识别一般信息,但对详细位置问题的处理还有待优化。用户可以通过控制detail参数调整模型处理图像的详略,并注意聊天API是无状态的,每次传递图像需重新发送。


图像识别



    通过URL分析远程图片:模型能精确识别图片内容,推荐使用URL而非Base64编码。
    本地图片识别:支持Base64编码,但效率较低,建议使用URL。
    处理多个图像:API可以处理多张图片,整合信息回答问题。

图像生成


基于文本提示的图像生成,DALL·E 3和DALL·E 2提供了高质量的图像,如设置为hd质量。生成的图像大小可自定义,且有生成链接可供下载。


编辑和变体图像


可以编辑图像并生成图像变体,仅限DALL·E 2模型,输入需为方形PNG图片。


文本生成


OpenAI的模型能处理自然语言、代码和图像,提供相关文本输出,如日常对话和代码解释。


聊天与JSON内容


提供JSON格式输出选项,增强模型的精确性和性能。例如,提问世界杯结果,返回结构化的JSON内容。


辅助功能



    Assistants API:构建AI助手,支持代码解释器、检索和函数调用,可用于扩展复杂需求。

其他特性



    语音生成与转文字:提供多种语音选项,支持实时音频流处理。
    天气查询示例:结合本地API增强模型功能。
    文本生成向量:推荐使用ada-002模型,高效且价格合理。

这些API功能的使用需注意收费和参数设置,用户需使用正式账户访问,非正常渠道的账号可能受限。详细了解费用与使用指南,可通过官方平台获取。

温馨提示:答案为网友推荐,仅供参考

相关了解……

你可能感兴趣的内容

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 非常风气网