所謂AI大模型,通常指的是在人工智能領(lǐng)域中,具有大量參數(shù)的深度學(xué)習(xí)模型,這些模型能夠捕捉和學(xué)習(xí)數(shù)據(jù)中的復(fù)雜模式和關(guān)系,從而在各種任務(wù)上表現(xiàn)出色。去年,大模型行業(yè)經(jīng)歷了如雨后春筍般的“百模大戰(zhàn)”,今年,業(yè)內(nèi)認(rèn)為迎來(lái)了大模型應(yīng)用元年。各類AI大模型應(yīng)用“上天入地,從宏觀到微觀”,開(kāi)始深度服務(wù)我們的生產(chǎn)和生活。
全球首顆AI大模型衛(wèi)星
讓衛(wèi)星更聰明
在今年的9月底,我國(guó)商業(yè)航天團(tuán)隊(duì)發(fā)射了全球第一顆AI大模型衛(wèi)星。那什么是AI大模型衛(wèi)星?它和普通的衛(wèi)星有什么不同?經(jīng)過(guò)一個(gè)多月的在軌測(cè)試,大模型衛(wèi)星運(yùn)行怎么樣?它能做些什么呢?
地球500公里外 衛(wèi)星上運(yùn)行AI大模型
這個(gè)畫(huà)面是遠(yuǎn)在500多公里外,衛(wèi)星上運(yùn)行AI大模型的場(chǎng)景。研發(fā)團(tuán)隊(duì)介紹,本次的發(fā)射任務(wù)主要是對(duì)AI大模型衛(wèi)星進(jìn)行在軌運(yùn)行試驗(yàn),測(cè)試不同溫度工況,以及完成和衛(wèi)星之間的各類推理問(wèn)答,目前各項(xiàng)任務(wù)執(zhí)行均獲得成功,這也標(biāo)志著一個(gè)智能衛(wèi)星的時(shí)代正在開(kāi)啟。
國(guó)星宇航首席執(zhí)行官 王磊:其實(shí)這個(gè)過(guò)程當(dāng)中就已經(jīng)產(chǎn)生了我們技術(shù)人員與衛(wèi)星之間的一個(gè)技術(shù)性互動(dòng)。因?yàn)檫b感數(shù)據(jù)的星上的數(shù)據(jù)是一個(gè)體量很大,而且是非規(guī)則化的這種數(shù)據(jù),現(xiàn)在大模型可以更好地對(duì)于一個(gè)區(qū)域,從目標(biāo)識(shí)別、特征提取,甚至到行為預(yù)測(cè),這就是得益于大模型的注入。比如道路的疏解,礦產(chǎn)資源的發(fā)現(xiàn),還有包括城市的規(guī)劃,很多的場(chǎng)景都在這種新的場(chǎng)景之下會(huì)得到極大的效率提升。
AI大模型衛(wèi)星 天上自主作決策
有了大模型技術(shù),衛(wèi)星無(wú)需將數(shù)據(jù)傳回地面,就可以作出相關(guān)的任務(wù)決策,大大提升了衛(wèi)星的工作效率。同時(shí),加入了AI大模型技術(shù)的衛(wèi)星,就仿佛開(kāi)啟了自動(dòng)駕駛模式的汽車,可以在天上進(jìn)行自我姿態(tài)的調(diào)整和任務(wù)指令的自行執(zhí)行。
為了將AI算力和系統(tǒng)從地面搬運(yùn)到天上,團(tuán)隊(duì)要解決一系列技術(shù)難題。
國(guó)星宇航首席執(zhí)行官王磊介紹,挑戰(zhàn)還是比較大的。地面的話從能源建筑體量,包括溫度濕度,很多的控制條件相對(duì)于太空框架是更加寬松一點(diǎn)。這里還包括重量等很多的因素,我采取什么樣的板卡芯片,然后這種接口如何對(duì)接和協(xié)議的適配,這種會(huì)產(chǎn)生一系列的技術(shù)問(wèn)題。
啟動(dòng)“星算計(jì)劃” 將算力系統(tǒng)搬到天上
將算力系統(tǒng)搬到天上后,團(tuán)隊(duì)還有更大的目標(biāo)。他們已啟動(dòng)“星算計(jì)劃”,將于2030年前建成由2800顆算力衛(wèi)星組網(wǎng)、全球覆蓋的“移動(dòng)”算力網(wǎng),助力人類更好地利用太空資源。
國(guó)星宇航首席執(zhí)行官 王磊:我覺(jué)得可能展望是隨著AI技術(shù)的發(fā)展和大模型技術(shù)的迭代,對(duì)于商業(yè)航天會(huì)有很大的改觀,甚至從整個(gè)工程設(shè)計(jì)理念都會(huì)帶動(dòng)、會(huì)產(chǎn)生很多設(shè)計(jì)方思路上的改變,這一點(diǎn)對(duì)這個(gè)行業(yè)會(huì)產(chǎn)生很大的促進(jìn)和推動(dòng)作用。
AI大模型“造字”
效率提升10倍以上
在我們身邊,大模型應(yīng)用在一些細(xì)分領(lǐng)域,正在顛覆傳統(tǒng)行業(yè)。比如利用大模型還可以創(chuàng)造不同的字體,可以讓效率提升10倍以上,成本也大大降低。一起去看看“AI設(shè)計(jì)師”是怎樣發(fā)揮創(chuàng)造潛力造字的。
這些風(fēng)格各異、細(xì)節(jié)滿滿、數(shù)量龐大的字體庫(kù),幾乎全部都是由AI設(shè)計(jì)完成的。這個(gè)不到十個(gè)人的“97后”創(chuàng)業(yè)團(tuán)隊(duì),僅用了18個(gè)月的時(shí)間,就已經(jīng)完成了300多套字體的設(shè)計(jì),字?jǐn)?shù)加起來(lái)已經(jīng)超過(guò)500萬(wàn)字,將一套字體的設(shè)計(jì)效率較傳統(tǒng)人工設(shè)計(jì)提升了10倍以上,成本也降低了80%。AI是如何學(xué)會(huì)造字的呢?團(tuán)隊(duì)工程師為我們介紹了整個(gè)學(xué)習(xí)過(guò)程。
圖形起源算法工程師 許璀杰:左邊這個(gè)是參考字,然后這個(gè)AI生成出來(lái)的字已經(jīng)很像了,如果我們把這兩個(gè)字重疊在一起,能夠看到有一些出入,黑色部分是重疊的,而藍(lán)色和黃色部分分別是這個(gè)參考字。我們會(huì)將之間的差值作為AI學(xué)習(xí)的目標(biāo),讓AI盡量地去減少它們之間的出入。然后AI通過(guò)不斷的學(xué)習(xí),可以看到它的出入是在逐漸減小的。
據(jù)圖形起源算法工程師介紹,現(xiàn)在AI大概能夠把正確率做到97%,AI這部分大概是兩天完成,如果沒(méi)有AI生成,生產(chǎn)周期可能一套字需要6到12個(gè)月。
AI大模型“造字”正改變字體設(shè)計(jì)行業(yè)
這個(gè)創(chuàng)業(yè)團(tuán)隊(duì)用AI改變的,正是字體設(shè)計(jì)行業(yè)。我們?cè)谟∷⑵?、包裝、網(wǎng)站上經(jīng)常能看到各種各樣的“字體”,這些字體是由字體設(shè)計(jì)師制作的。在一個(gè)字體文件中,每個(gè)字都是一張矢量圖,因此要制作一套字體,需要把對(duì)應(yīng)語(yǔ)言中的每個(gè)字都手工繪制出來(lái),比如漢字字體的設(shè)計(jì)師,可能需要繪制多達(dá)3萬(wàn)個(gè)字,還需進(jìn)行反復(fù)的細(xì)節(jié)調(diào)整,來(lái)確保每個(gè)字的正確性、美觀性和一致性,可想而知工作量極其龐大,這也直接導(dǎo)致了應(yīng)用端,大家需要花費(fèi)昂貴的版權(quán)費(fèi)來(lái)承擔(dān)字體的設(shè)計(jì)成本。而這個(gè)創(chuàng)業(yè)團(tuán)隊(duì)就敏銳捕捉到了傳統(tǒng)行業(yè)的特點(diǎn),并用人工智能大模型技術(shù)來(lái)提質(zhì)增效。
AI大模型可開(kāi)發(fā)多語(yǔ)言符號(hào)字庫(kù)
團(tuán)隊(duì)通過(guò)不斷摸索試錯(cuò),用技術(shù)解決真需求,不斷迭代技術(shù)能力,在算法、算力方面進(jìn)行優(yōu)化,讓大模型造字變得越來(lái)越可用。他們的字體生成能力還可以開(kāi)發(fā)日、韓、拉丁字母等眾多語(yǔ)言和符號(hào)的字庫(kù),他們還在研究將傳統(tǒng)書(shū)法家的毛筆字進(jìn)行矢量化學(xué)習(xí),設(shè)計(jì)成書(shū)法家字庫(kù),從而發(fā)揚(yáng)傳統(tǒng)的漢字文化。
記者探訪迭代中的“AI打工人”
AI大模型的超強(qiáng)學(xué)習(xí)能力,讓我們看到了它在各行各業(yè)的應(yīng)用潛力。和任何一種技術(shù)的發(fā)展一樣,人工智能也需要不斷的學(xué)習(xí)和迭代,才能變得可用、好用。
用文字轉(zhuǎn)化成記者的語(yǔ)音生成的視頻,在幾分鐘內(nèi),一個(gè)以記者聲音和形象進(jìn)行播報(bào)的視頻就生成了。
電商直播數(shù)字人大模型 聲音文字秒級(jí)生成
在工作室里,記者只需要對(duì)著鏡頭錄制一段幾分鐘的畫(huà)面,隨后上傳到系統(tǒng),再在系統(tǒng)里任意編輯自己想要表達(dá)的文字內(nèi)容,就可以在一兩分鐘內(nèi),生成一段播報(bào)的內(nèi)容。技術(shù)人員告訴記者,目前AI大模型技術(shù)還很難實(shí)時(shí)做到表情的模擬,但是在聲音和文字內(nèi)容的快速生成上,已經(jīng)做到了秒級(jí)。通過(guò)這種快速生成的能力,團(tuán)隊(duì)推出了國(guó)內(nèi)首個(gè)電商直播數(shù)字人大模型,并已經(jīng)投放進(jìn)了市場(chǎng)。
當(dāng)記者在直播間隨機(jī)問(wèn)數(shù)字主播,我想吃一個(gè)辣的,很快就得到了主播的回復(fù)。聲音細(xì)節(jié)、節(jié)奏,還有回復(fù)內(nèi)容,能夠做到精準(zhǔn)且快速,還充滿個(gè)性化,數(shù)字人利用大模型直播有了落地的可能。
零一萬(wàn)物首席執(zhí)行官李開(kāi)復(fù)介紹,大模型的計(jì)算是要花很多的GPU芯片和算力,也是有很高的成本的。在過(guò)去有些美國(guó)的大廠做一次訓(xùn)練,可能就要花1億甚至10億美元,我們的速度可以比open AI的模型要快30~40倍。而且它的成本是美國(guó)公司的1/30,所以它是可以點(diǎn)燃應(yīng)用的。
集成式開(kāi)發(fā)模式 模型訓(xùn)練推理“多快好省”
大模型動(dòng)輒上億的訓(xùn)練成本和推理成本,令很多開(kāi)發(fā)者和大模型初創(chuàng)企業(yè)望而卻步。為了讓模型落地,真正好用,開(kāi)發(fā)者們關(guān)注的并不能僅僅是生成的質(zhì)量,還要在成本和好用性上去下功夫。在訓(xùn)練模型過(guò)程中,一個(gè)集成式的開(kāi)發(fā)模式發(fā)揮了作用,讓模型訓(xùn)練和推理都做到“多快好省”。
“智能體”將如何改變我們的生活
隨著AI大模型技術(shù)的不斷落地,為我們身邊的各類硬件設(shè)備走向“智能”,提供了技術(shù)支持。“智能體”就隨之成了一個(gè)新的高頻詞。什么叫做智能體,這種新技術(shù)又將會(huì)怎樣改變我們的生活呢?
智能體,簡(jiǎn)單來(lái)說(shuō),就是將人工智能大模型與各種智能硬件相結(jié)合,打造出的智能系統(tǒng)。和傳統(tǒng)硬件相比,它們能夠根據(jù)預(yù)設(shè)好的規(guī)則和目標(biāo),獨(dú)立自主地執(zhí)行任務(wù)、理解并響應(yīng)人類的需求。比如在手機(jī)上,我們已經(jīng)可以用一句話,讓手機(jī)自主完成點(diǎn)外賣、全程無(wú)需人來(lái)插手。
智能體產(chǎn)品工程師 江洪澤:通過(guò)大模型的理解能力,我們可以將用戶的意圖,拆解成很多個(gè)步驟,然后按照一定的方式編排,一個(gè)任務(wù)、一個(gè)任務(wù)地去幫助用戶自動(dòng)完成,達(dá)成手機(jī)上的“自動(dòng)駕駛”的這種體驗(yàn)。
多層分級(jí) 打造“智能”新標(biāo)準(zhǔn)
隨著智能在終端設(shè)備中的爆發(fā),智能體的智能化標(biāo)準(zhǔn)也成了行業(yè)發(fā)展必不可少的關(guān)鍵。
近期,中國(guó)信息通信研究院牽頭發(fā)布了全球首份《終端智能化分級(jí)研究報(bào)告》,參考汽車自動(dòng)駕駛的分級(jí)標(biāo)準(zhǔn),這份報(bào)告將終端智能化水平由低到高分為L(zhǎng)1—L5五個(gè)等級(jí),等級(jí)越高,意味著終端在任務(wù)完成中的自主參與程度越高。幫助消費(fèi)者理解他們的設(shè)備能做什么,也為產(chǎn)業(yè)發(fā)展提供了一份清晰的技術(shù)路線圖。
中國(guó)信通院泰爾終端實(shí)驗(yàn)室副主任 果敢:我們?cè)诜旨?jí)這個(gè)方面主要從4個(gè)維度四大因素去考慮。首先對(duì)用戶的意圖理解的程度。另外從對(duì)用戶信息、用戶使用習(xí)慣的學(xué)習(xí)記憶的能力去考慮。后面兩個(gè)就是從提供服務(wù)和規(guī)劃任務(wù)的能力的程度,還有任務(wù)的執(zhí)行完成情況這4個(gè)維度,去設(shè)計(jì)了1~5級(jí)的這種整個(gè)的分級(jí)的類別。
智能終端距完全自動(dòng)化智能化仍有距離
據(jù)介紹,根據(jù)分級(jí)標(biāo)準(zhǔn),目前智能終端發(fā)展階段普遍在L2—L3級(jí)別之間,即能感知用戶簡(jiǎn)單的意圖,并提供個(gè)性化服務(wù),但距離完全的自動(dòng)化和智能化,仍然有著不短的距離。
清華大學(xué)人工智能研究院常務(wù)副院長(zhǎng) 孫茂松:大模型它非常的厲害,但是它不是萬(wàn)能的,有它的局限性。總的來(lái)說(shuō),它在語(yǔ)言、文字、語(yǔ)音、圖像、視頻這方面的理解和生成能力,應(yīng)該說(shuō)超過(guò)了可能85%的人類。15%的問(wèn)題可能就要和應(yīng)用場(chǎng)景去結(jié)合,通過(guò)應(yīng)用和應(yīng)用場(chǎng)景結(jié)合去想辦法彌補(bǔ)這15%的問(wèn)題。