11月24日,由中央網(wǎng)信辦、中央廣播電視總臺、廣東省委網(wǎng)信委聯(lián)合主辦的2021中國網(wǎng)絡媒體論壇在廣東省廣州市開幕。在技術論壇上,人民日報社傳播內(nèi)容認知國家重點實驗室與人民中科共同發(fā)布了全球首款面向內(nèi)容安全的跨模態(tài)視頻搜索引擎——“白澤”,人民日報社傳播內(nèi)容認知國家重點實驗室主任,人民網(wǎng)黨委書記、董事長、總裁葉蓁蓁介紹了相關情況。
據(jù)悉,內(nèi)容風控大腦是對全網(wǎng)海量內(nèi)容進行高通量感知、機器理解、智能檢索并自主進化的計算平臺,“白澤”則是該計算平臺的核心組件。內(nèi)容風控大腦全部技術組件均實現(xiàn)國產(chǎn)化部署,提供視頻搜索、內(nèi)容風控、開源情報、反詐反恐、內(nèi)容溯源、版權保護、實訓靶場等多功能。鑒于跨平臺、跨模態(tài)的視頻搜索引擎是探索數(shù)字世界的重要工具,有巨大社會價值和商業(yè)前景,該引擎擬獨立運營,以“白澤”作為商品名對外提供服務。
葉蓁蓁表示,當前,各大主流媒體已進入多模態(tài)階段,可實現(xiàn)文字、圖片、視頻搜索,但相互間的壁壘依然存在,人民網(wǎng)率先進入跨模態(tài)搜索領域,實現(xiàn)文字、圖片、音視頻互聯(lián)互通。
當前,基于單個模態(tài)的內(nèi)容提取及簡單規(guī)則匹配的內(nèi)容分析策略,已無法滿足實際工作需要。對此,各廠商紛紛推出基于多模態(tài)融合和復合規(guī)則判斷的多模態(tài)策略,但仍面臨依賴大規(guī)模算力、模態(tài)之間信息相互隔離、運行和維護成本高、資源復用率低等問題。此次發(fā)布的“白澤”引擎,基于跨模態(tài)視頻檢索的策略,其跨模態(tài)引擎可實現(xiàn)單模態(tài)語義理解、多模態(tài)信息融合、跨模態(tài)語義關聯(lián),補全單一模態(tài)信息不足的現(xiàn)狀,打破模態(tài)間信息孤島。
據(jù)介紹,“白澤”引擎將文字、圖片、語音和視頻等不同模態(tài)信息映射到一個統(tǒng)一特征表示空間,以視頻為核心,學習多個模態(tài)間統(tǒng)一的距離度量,跨越文字、語音、視頻等多模態(tài)內(nèi)容的語義鴻溝,自動關聯(lián)多模態(tài)間關鍵要素。
在此背景下,“白澤”引擎無需配置傳統(tǒng)內(nèi)容搜索所需的復雜匹配規(guī)則,通過自然語言描述即可快速檢索出相同語義的視頻,在不需要依賴大規(guī)模算力的情況下,有效應對新事件和突發(fā)事件,資源復用率高。
此外,面向內(nèi)容安全,“白澤”結(jié)合對境內(nèi)外多平臺內(nèi)容的檢索,可跨平臺實現(xiàn)文本搜圖片、文本搜視頻、圖片搜視頻、視頻搜視頻、圖片搜文字、視頻搜文字等功能。在論壇現(xiàn)場,葉蓁蓁展示了“白澤”在視頻搜索、溯源和辟謠、版權監(jiān)測、視頻生產(chǎn)等商業(yè)化應用場景的功能。
同時,為提升“白澤”引擎的安全和效率,人民中科基于華為昇騰芯片研發(fā)了面向內(nèi)容理解的“雨燕”智能計算加速卡,并采用全自主研發(fā)的模型壓縮和加速算法,同等條件下能夠?qū)崿F(xiàn)4倍效率的提升。
轉(zhuǎn)自:人民網(wǎng)
【版權及免責聲明】凡本網(wǎng)所屬版權作品,轉(zhuǎn)載時須獲得授權并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關法律責任的權力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權事宜請聯(lián)系:010-65363056。
延伸閱讀