圖:商湯AI新應(yīng)用 相片生成1分鐘短片
【大公報(bào)訊】商湯(00020)昨宣布,推出首個(gè)向用戶開放的可控人物視頻生成大模型Vimi,基于商湯日日新大模型(SenseNova)的能力,一張照片可生成長(zhǎng)達(dá)1分鐘的人物短片,突破目前市面上只能生成3至4秒的技術(shù)。
2024世界人工智能大會(huì)昨日上海揭幕,商湯推出的生成大模型Vimi成為大會(huì)最創(chuàng)新展品。
目前,行業(yè)中80%短片都以人物為主要題材,加上短片、直播平臺(tái)崛起,以人物為主體的短片需求大幅增長(zhǎng)。Vimi的特點(diǎn)在于只需一張任何風(fēng)格的照片,便能生成與目標(biāo)動(dòng)作一致的人物類短片,并支持多種驅(qū)動(dòng)方式,包括通過(guò)已有人物影片、動(dòng)畫、聲音、文字等元素進(jìn)行驅(qū)動(dòng)。
目前,市場(chǎng)上有不少讓照片中人物動(dòng)起來(lái)的技術(shù),惟仍然受制于多項(xiàng)因素,例如人物動(dòng)作、表情動(dòng)作無(wú)法精準(zhǔn)控制,需要頻繁輸入多項(xiàng)“指令”,務(wù)求提升結(jié)果精準(zhǔn)度。據(jù)介紹,Vimi可實(shí)現(xiàn)精準(zhǔn)的人物表情控制,還可控制照片中人物上半身的自然肢體動(dòng)作,并自動(dòng)生成與人物相符的頭發(fā)、服飾及背景變化。同時(shí),光影變化亦能做到合理生成,讓人物動(dòng)作和視覺(jué)效果流暢自然。
Vimi已在商湯網(wǎng)開放預(yù)約,將于今日商湯舉辦的“大愛無(wú)疆.向新力”人工智能論壇上披露更多細(xì)節(jié)。用戶現(xiàn)可上傳不同角度的高清人物照片,即可自動(dòng)生成數(shù)字分身和不同風(fēng)格的寫真短片。