4月27日,2024中關(guān)村論壇年會上首次發(fā)布我國自研的具“長時長、高一致性、高動態(tài)性”特點的文生視頻大模型Vidu。這一視頻大模型由清華大學(xué)聯(lián)合北京生數(shù)科技有限公司共同研發(fā),可根據(jù)文本描述直接生成長達(dá)16秒、分辨率高達(dá)1080P的高清視頻內(nèi)容。
Vidu, a text-to-video large AI model capable of creating a 16-second, high-definition video in 1080p resolution with a single click, was unveiled on April 27 at the 2024 Zhongguancun Forum. Developed by Tsinghua University and Chinese AI firm ShengShu Technology, Vidu is China's first video large AI model with "extended duration, exceptional consistency and dynamic capabilities".
【知識點】
Vidu是自Sora發(fā)布之后全球率先取得重大突破的視頻大模型。與Sora一致,Vidu能夠根據(jù)提供的文本描述直接生成長達(dá)16秒的高質(zhì)量視頻。除了在時長方面的突破外,Vidu在視頻效果方面實現(xiàn)顯著提升,主要體現(xiàn)在模擬真實物理世界、多鏡頭語言、時空一致性高、理解中國元素等方面。
在動態(tài)性方面,Vidu能生成復(fù)雜的動態(tài)鏡頭,不再局限于簡單的推、拉、移等固定鏡頭,而是能在一段畫面里實現(xiàn)遠(yuǎn)景、近景、中景、特寫等不同鏡頭的切換,包括能直接生成長鏡頭、追焦、轉(zhuǎn)場等效果。
【函電賀詞】
當(dāng)前,互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、人工智能、區(qū)塊鏈等新技術(shù)深刻演變,產(chǎn)業(yè)數(shù)字化、智能化、綠色化轉(zhuǎn)型不斷加速,智能產(chǎn)業(yè)、數(shù)字經(jīng)濟(jì)蓬勃發(fā)展,極大改變?nèi)蛞刭Y源配置方式、產(chǎn)業(yè)發(fā)展模式和人民生活方式。
New technologies such as the internet, big data, cloud computing, artificial intelligence and blockchain are undergoing profound changes; the digitalized, intelligent and green transformation of industries are accelerating; and the intelligent industry and digital economy are thriving. These have greatly changed the global allocation of factors and resources, industrial development models, and people's lifestyles.
——2023年9月4日,習(xí)近平致2023中國國際智能產(chǎn)業(yè)博覽會的賀信
【相關(guān)詞匯】
智能產(chǎn)業(yè)
intelligent industry
算力
computing power
中國日報網(wǎng)英語點津工作室(本文于“學(xué)習(xí)強(qiáng)國”學(xué)習(xí)平臺首發(fā))