人工智能AI科技企业OpenAI公司25日宣布,其聊天应用程序ChatGPT如今具备「看、听、说」能力,至少能够理解口语、用合成语音回应并且处理图像;但专家忧心,以假乱真与深度伪造的乱象可能变本加厉。
国家广播公司新闻网(NBC News)报导,OpenAI推出GPT-4以来,这次是聊天机器人最大幅度功能更新,用户可选择在ChatGPT行动应用程序上进行语音对话,并替机器人从五种不同的合成声音中择一回应,还可以和ChatGPT共享图像、并且凸显重点或分析。
OpenAI表示,预计两周内对付费用户推出更新功能;语音功能将仅限于苹果公司的iOS系统和谷歌系统的Android应用程序,图像传感器处理功能将适用于所有平台。
在聊天机器人开发领导厂商OpenAI、微软(Microsoft)、谷歌(Google)及Anthropic等公司的人工智能竞赛日趋激烈下,ChatGPT功能不断突破,而且加速。为鼓励消费者在日常生活中使用生成式人工智能,科技巨头相继推出新的聊天机器人应用程序,并推出新功能,今夏动作频频,谷歌宣布针对其聊天机器人Bard进行一连串更新,微软则宣布搜寻引擎Bing添加机器视觉搜寻功能。
专家对人工智能生成的合成声音表示担忧,担心可能以假乱真、深度伪造;据悉,网络威胁分子和研究人员已开始探索如何利用深度伪装技术入侵网络安全系统,也担心成为诈骗新工具。
OpenAI也意识到潜在的伪造威胁,声称合成声音是由该公司直接合作过的配音演员所创建,不是向陌生人收集。
针对Open AI如何使用消费者语音输入、或者将如何保护这些资料等重点,Open AI服务条款称,在适用法律所允许范围内,消费者将拥有自己的输入内容。
PitchBook称,今年稍早,微软加码投资OpenAI达100亿元,是今年度最大人工智能投资;据报导,OpenAI今年4 月出售3亿元股票,投资者包括红杉资本(Sequoia Capital)和安德森霍洛维茨(Andreessen Horowitz)等投资公司。
*免责声明:文章来源于网络,如有争议,请联系客服。