OpenAI为ChatGPT图像功能“添翼”，挑战与机遇并存

Gaiety • 2025年3月26日 08:20 • 阅读 • 阅读 10

ChatGPT图像生成功能的历史性升级，包括升级后的功能表现、定位、存在的问题、生成图像所需时间以及新功能的推出安排等内容。

智通财经APP消息显示，ChatGPT的图像生成功能迎来了具有历史意义的升级。OpenAI正在努力让ChatGPT中的图像编辑以及为包含冗长且易读文本的工作创建视觉效果变得更为轻松，这一改变很可能会提升聊天机器人对企业和日常用户的吸引力。

在周二举办的直播活动中，这家位于旧金山的公司展示了ChatGPT用户如何通过与聊天机器人进行一系列对话来优化图像。据该公司透露，ChatGPT还将更擅长创建带有连贯文本的图像，在为专业用途提供图表、信息图表和徽标等方面表现更出色。实际上，ChatGPT已经能够大致准确地按照提示词生成图像中的文本。在演示环节，AI成功按照要求生成了一整页的讲话文本，而且没有出现错别字。举例来说，用户可以提示聊天机器人生成自定义菜单或地图的逼真图像。该公司还表示，ChatGPT将能够执行用户关于图像构图的更复杂指令。

OpenAI愈发希望将ChatGPT打造成一款集搜索引擎、语音助手和视频生成器等多种功能于一体的全能应用。随着此次最新改进，OpenAI正尝试整合更先进的图像功能，这些功能既适用于个人，也适用于专业场景。这或许有助于ChatGPT保持领先于竞争对手的聊天机器人，比如埃隆·马斯克（Elon Musk）旗下的xAI，后者也增加了图像生成器。

然而，和其他人工智能应用一样，ChatGPT在生成图像时可能会编造一些不实内容，例如在图片上包含带有假国家名称的文本。该公司在一篇博客文章中指出，这些错误可能会在用户提示不够详细的情况下出现。此外，OpenAI还表示，其人工智能在处理小尺寸文本和非拉丁字母文本等方面存在困难。

根据该公司博客文章所述，使用更新后的功能生成图像需要一分钟的时间。OpenAI首席执行官萨姆·奥特曼（Sam Altman）在直播过程中解释称，这是因为生成的图像更详细，所以需要更长时间。

新功能将于周二通过OpenAI的GPT – 4o模型提供，该模型对免费和付费用户均开放。该公司表示，将在未来几周内向使用其应用程序编程接口的软件开发人员推出这些新功能。

ChatGPT图像生成功能的升级展开，介绍了升级后的诸多优势，如优化图像、生成连贯文本图像等，也指出了存在的问题，如生成不实内容、处理特定文本有困难等。同时说明了生成图像所需时间以及新功能的推出安排，此次升级有望提升ChatGPT竞争力，但也面临一些挑战。

原创文章，作者：Gaiety，如若转载，请注明出处：https://www.yanghehb.com/5266.html