美國人工智慧公司「OpenAI」宣布,從7月29日起,向部分付費的「ChatGPT Plus」客戶推出語音功能,並於8月初公布「GPT-4o」的功能、限制和安全評估的詳細報告,預計所有的「ChatGPT Plus」客戶在今年秋季前就能使用。
OpenAI在聲明中指出,即將推出的語音功能將可以直接「打斷」它的回答,同時有更多「情緒化」的回覆「就像與人交談一樣」。此外,「SearchGPT」是新搜尋功能的原型,希望將AI與網路最新資訊結合,透過搜索不同資料整合來提供快速、及時的答案,也會附上來源的連結,讓用戶能快速找出更多相關資訊,還可以透過問答對話進行交流,辨識使用者的語調,來產生不同的聲音。
OpenAI表示:「透過逐步推出,我們可以密切監控使用情況,並基於真實世界的回饋,不斷改良模型能力和安全性。」並強調會持續推出更多新功能及產品,視訊與螢幕共享的功能還在研發中。 OpenAI研究人員在視訊活動中展示,新功能讓使用者在與ChatGPT進行對話時,可以毫無延遲地獲得即時回答,甚至能在ChatGPT講話時打斷它,這兩項逼真對話的特點在聊天機器人上前所未見。
此外,「GPT-4o」將更直覺化的讓消費者可以透過這項服務完成各種任務,同時增加其運作效率,會比「GPT-4-turbo」快上約2倍以上,且價格只需要原先的一半。 OpenAI指出,語音功能將支援45種語言,為了保護個人隱私,訓練模板只會使用4種預設聲音說話。被選到的用戶會收到一封電子郵件,裡面包含使用說明及相關資訊,預計讓所有Plus用戶在「今年秋季前」使用到新功能。
語音功能是5月發布「GPT-4o」時的核心項目,除了改善ChatGPT的體驗模式,「GPT-4o」將為人工智慧的發展帶來重大突破。
◤2024史上最熱一年◢