色婷婷色综合激情国产日韩,国产在线麻豆精品,日韩亚洲专区在线电影,av777,午夜色站,亚洲第一网站在线观看,国内偷自第一二三区

客戶端
官方微信
官方微博
今日頭條
北疆觀察
數(shù)字報刊
北疆新聞 > 教育 > 正文
新大模型可根據(jù)文本生成高清視頻
2024年04月28日 08:34 來源:科技日報 關燈

27日,在中關村論壇未來人工智能先鋒論壇上,清華大學聯(lián)合北京生數(shù)科技有限公司(以下簡稱“生數(shù)科技”)正式發(fā)布中國首個原創(chuàng)全自研視頻大模型——Vidu。論壇現(xiàn)場,清華大學教授、生數(shù)科技首席科學家朱軍向與會者展示了Vidu生成的視頻,包括行駛在崎嶇道路上的汽車、戴珍珠耳環(huán)的貓、彈吉他的熊貓等。與此前震撼業(yè)界的Sora一樣,Vidu能夠根據(jù)文本描述直接生成高質量視頻。

“長時長、高一致性、高動態(tài)性”是Vidu的顯著特征。朱軍表示,研發(fā)團隊的核心技術在于采用U-ViT架構。它由Diffusion與Transformer兩個模型融合而來,可支持一鍵生成長達16秒的高清視頻內容。

除了在時長方面優(yōu)勢突出,Vidu在視頻效果方面也實現(xiàn)顯著提升。朱軍介紹,Vidu能模擬真實物理世界,生成的視頻不但場景細節(jié)復雜,而且符合物理規(guī)律,例如合理的光影效果、細膩的人物表情等。Vidu還具有豐富的想象力,能生成真實世界不存在的虛構畫面,創(chuàng)造出具有深度和復雜性的超現(xiàn)實主義內容。此外,Vidu可理解多鏡頭語言,生成的視頻不再局限于簡單的推、拉、移等固定鏡頭,而是圍繞同一主體實現(xiàn)遠景、中景、近景、特寫等不同鏡頭的切換,甚至能直接生成長鏡頭、追焦、轉場等效果,給視頻注入豐富的鏡頭表達。Vidu還獨具文化特色,能很好理解中國元素,生成熊貓、龍等中國元素的視頻。

值得一提的是,論壇上展示的視頻都是從頭到尾連續(xù)生成,沒有明顯的插幀現(xiàn)象。朱軍說,與Sora一樣,Vidu在文本到視頻的轉換過程中直接且連續(xù),而且在底層算法上,是由單一模型完全端到端生成,不涉及插幀和其他多步驟處理。(記者何亮)

北疆新聞:內蒙古自治區(qū)重點新聞網站(客戶端),內蒙古出版集團新華報業(yè)中心旗下國家互聯(lián)網新聞信息采編發(fā)布服務一類資質網站(客戶端)。

編輯:方琳
89

北疆新聞版權與免責聲明:

一、凡本站中注明“來源:北疆新聞”的所有文字、圖片和音視頻,版權均屬北疆新聞所有,轉載時必須注明“來源:北疆新聞”,并附上原文鏈接。

二、凡來源非北疆新聞的新聞(作品)只代表本網傳播該消息,并不代表贊同其觀點。

如因作品內容、版權和其它問題需要同本網聯(lián)系的,請在見網后30日內進行,聯(lián)系郵箱:bjwmaster@163.com。

共建地球生命共同體丨走進三江源“野生動物”王國

版權聲明:北疆新聞版權所有,未經書面授權,不得轉載或建立鏡像,違者依法必究。 本站違法和不良信息舉報電話:15648148811蒙ICP備16001043號-1

Copyright © 2016- 北疆新聞網 All Rights Reserved互聯(lián)網新聞信息服務許可證:15120200009-1蒙公網安備:15010502001245