品牌方舟获悉,近日,OpenAI宣布,在GPT-4o模型中新增图像生成功能,使其能够生成更加精确且高度逼真的图像。此次升级不仅提升了文本渲染能力,还增强了模型对复杂提示的理解和执行能力,为用户提供更加自然的图像创作体验。
GPT-4o的图像生成能力涵盖多个方面,包括改进的文本渲染,使其能够准确地将符号与图像融合;多轮交互式生成,允许用户在对话中调整和优化图像;以及更强的指令执行能力,使其可以按照复杂提示生成包含多达20个不同对象的图像。此外,该模型能够从用户上传的图像中学习,以提高生成质量,并结合文本和视觉知识,实现更加高效的创作。
所有由GPT-4o生成的图像都将附带C2PA元数据,以明确标识其为人工智能(AI)生成的内容。同时,OpenAI仍将严格执行内容政策,阻止违反规定的生成请求。
从3月25日起,GPT-4o的图像生成功能已逐步向Plus、Pro、Team及免费用户开放,并计划在未来推广至企业级(Enterprise)和教育(Edu)用户。OpenAI表示,用户只需像与GPT-4o聊天一样描述所需图像,包括纵横比、特定颜色(可使用十六进制代码)或透明背景等细节,即可生成和定制图像。
GPT-4o最初于去年5月推出,相较于前代模型,其在文本、视觉和音频处理方面均有显著改进,并对所有用户免费开放,而付费订阅用户可享受更高的使用上限。去年8月,OpenAI还发布了一项更新,允许开发者针对特定业务需求微调GPT-4o,为各行业的定制化AI应用提供更多可能性。
作者✎ Summer/品牌方舟
声明:此文章版权归品牌方舟所有,未经允许不得转载,如需授权请联系:amz123happy