美國開放人工智能研究中心13日展示了最新版本ChatGPT的新技能:與使用者展開語音對話、識別圖像并展開討論、翻譯……
GPT-4o為新版本編號。據(jù)路透社報道,相比先前版本,GPT-4o與使用者對話基本無延遲,和人類反應(yīng)速度類似。即使對話中途被打斷,也能繼續(xù)下去。這些都是實現(xiàn)逼真語音對話的標(biāo)志,也是當(dāng)前眾多人工智能語音助手普遍面臨的技術(shù)難點(diǎn)。
在當(dāng)天網(wǎng)絡(luò)直播的展示中,這款生成式人工智能工具利用其視覺和語音能力,指導(dǎo)演示者在紙上逐步解出一道方程題,而不是直接給出答案。它還展示了英語與意大利語互譯、用自拍照片識別情緒等能力。當(dāng)一名演示者告訴它,自己正展示它是“多么有用和不可思議”時,它回答道:“哦,快別說了,怪害臊的。”
開放人工智能研究中心首席執(zhí)行官薩姆·奧爾特曼當(dāng)天在博客中寫道,GPT-4o就像“電影中的人工智能”技術(shù)。“與電腦交談一直讓我感覺不自然,現(xiàn)在自然了?!?/p>
開放人工智能研究中心首席技術(shù)官米拉·穆拉蒂在當(dāng)天活動中說,GPT-4o將于今后幾周內(nèi)上線,用戶可免費(fèi)試用。ChatGPT原有付費(fèi)用戶將獲得新版本更多使用權(quán)限。
路透社報道,開放人工智能研究中心希望以GPT-4o在激烈的人工智能技術(shù)競爭中保持領(lǐng)先。該公司2022年發(fā)布ChatGPT后,短時間內(nèi)每月活躍用戶增至1億。然而,研究機(jī)構(gòu)西米勒網(wǎng)絡(luò)公司的數(shù)據(jù)顯示,去年以來ChatGPT用戶人數(shù)呈現(xiàn)過山車式變化,近期才重回去年5月巔峰時期的水平。
近年來,開發(fā)更人性化、功能更強(qiáng)大的生成式人工智能工具競爭激烈。谷歌母公司字母表公司擬于14日召開谷歌開發(fā)者年度會議,預(yù)計屆時將展示谷歌開發(fā)的相關(guān)產(chǎn)品。硅谷企業(yè)家埃隆·馬斯克、技術(shù)企業(yè)“深層思維”創(chuàng)始人之一穆斯塔法·蘇萊曼也分別投資開發(fā)了聊天機(jī)器人Grok和Pi,將擬人化特點(diǎn)作為產(chǎn)品主攻方向。
在英國廣播公司看來,GPT-4o能夠結(jié)合文本、音頻和圖像內(nèi)容瞬間做出反應(yīng),目前在競爭中仍處于領(lǐng)先地位。(袁原)
轉(zhuǎn)自:新華每日電訊
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀