5月19日,在第七屆世界智能大會上,由國家超級計(jì)算天津中心“天河E級智能計(jì)算開放創(chuàng)新平臺”訓(xùn)練研發(fā)的“天河天元大模型”正式發(fā)布。該模型是立足國產(chǎn)天河超級算力和智能算力,匯集構(gòu)建中文大數(shù)據(jù)集,由平臺自主訓(xùn)練研發(fā)的大型模型。
生成式通用智能是重大變革性突破。以ChatGPT為代表的生成式智能開啟了人工智能發(fā)展新階段。與單一判別式智能工具不同,生成式智能是文本生產(chǎn)、數(shù)據(jù)分析、代碼編寫、圖像生成等跨媒體多模態(tài)領(lǐng)域的通用智能工具,將滲入到生產(chǎn)、教育、工作生活等場景,并對人類生產(chǎn)方式、思想認(rèn)知、社會治理等帶來變革性影響,將重塑人與智能機(jī)器生產(chǎn)關(guān)系。
訓(xùn)練模型以數(shù)據(jù)和算力為基礎(chǔ)。谷歌BERT、OpenAI的GPT和百度文心大模型其參數(shù)規(guī)模已提升至千億、萬億,并隨之帶來巨大的數(shù)據(jù)量級需求。
天津依托天河占據(jù)了全國超過20%的超級計(jì)算算力資源,成為算力賦能科技創(chuàng)新和產(chǎn)業(yè)發(fā)展重鎮(zhèn)。天河E級智能計(jì)算開放創(chuàng)新平臺將帶來突破百億億次的多精度融合超級計(jì)算算力。
天津超算中心搜集整理了網(wǎng)頁數(shù)據(jù)、各種開源訓(xùn)練數(shù)據(jù)、古文數(shù)據(jù)、百科數(shù)據(jù)、新聞數(shù)據(jù),以及專業(yè)領(lǐng)域的中醫(yī)、醫(yī)藥、問診、法律等多種數(shù)據(jù)集,訓(xùn)練打造了自主研發(fā)的中文語言大模型——天河天元大模型。同時(shí)啟動面向醫(yī)療、工業(yè)、法律等領(lǐng)域?qū)I(yè)模型深度訓(xùn)練,模型將作為產(chǎn)業(yè)智能化升級基座,用專業(yè)數(shù)據(jù)集,打造更貼合行業(yè)領(lǐng)域的智能化高水平“專家”。
未來,以生成式AI為基座的產(chǎn)業(yè)鏈,將成為智能化升級過程中可大規(guī)模復(fù)用的基礎(chǔ)設(shè)施。在大模型通用性、泛化性以及降低人工智能應(yīng)用門檻的優(yōu)勢推動下,人工智能也將會加快落地,形成新的機(jī)遇。(經(jīng)濟(jì)日報(bào)記者 商瑞)
轉(zhuǎn)自:經(jīng)濟(jì)日報(bào)客戶端
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀