0°

OpenAI推出全新ChatGPT版本:多模AI机器人,实现语音与图像交互

  OpenAI在其官网宣布,他们正在推出ChatGPT的新版本,这个基于人工智能的机器人现在可以通过不同的方式理解人类的问题,从而进一步提供更具多模式和有用性的虚拟助手功能。

  在语音方面,这个新版本的ChatGPT不仅可以通过文本框交互,还可以通过语音对话与用户进行互动。这种语音交互方式更直观,同时也支持在iOS和Android移动应用上使用。通过改进的文本到语音模型以及语音识别系统的支持,用户可以通过大声说话与ChatGPT进行交流,并选择五种不同的语音风格。

  此外,OpenAI还与流媒体音乐服务平台Spotify合作,利用新的文本到语音模型将播客翻译成其他语言,并保留播音者的声音。这个新的合成语音功能可能在多个领域中有着广泛的应用和潜力。

  在图像方面,用户现在可以通过上传图片的方式与ChatGPT进行交互。ChatGPT利用多模态GPT模型来理解图像,并根据用户提供的问题或文本进行回应。为了帮助用户更好地表达自己的需求,ChatGPT还提供了移动应用上的绘图工具。

  尽管增加语音和图像功能能够为用户提供更多灵活性和便利性,OpenAI也表示他们会采取渐进的策略来确保安全性和避免潜在的风险。他们限制了ChatGPT对于关于人的问题的解答能力,以确保准确性和隐私保护。

  然而,随着越来越多的人使用语音控制和图像搜索,维持住这种护栏将变得越来越困难。OpenAI仍在努力平衡提供更多功能和能力与保持安全性的挑战,并不断寻找解决这些问题的方法。

  这次的更新使得ChatGPT的功能更加强大和多样化,使其接近成为一个全方位的虚拟助手。我们期待看到这个新版本的ChatGPT在不久的将来能够帮助用户更好地解决问题,提供更多实用的功能。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论