業內專業AI公司發布全新的重慶3D動畫制作技術
人工智能平臺公司云從科技近日發布了其在3D人體重建技術上取得的重大突破。3月19日,作為“國內CV(計算機視覺)四小龍”之一的云從科技(以下簡稱云從)宣布,重慶影視公司其基于單幀圖像的3D人體(ti)重建(jian)技術(shu)刷新了三項世(shi)界紀錄(lu),這也是繼去(qu)年云從在3D人臉數據集上(shang)大幅刷新紀錄(lu)后,再次(ci)在此類(lei)3D重建(jian)技術(shu)上(shang)取得重要成果。
所謂的(de)(de)(de)三項(xiang)世界紀錄,指的(de)(de)(de)是Human3.6M、Surreal和(he)UP-3D三個(ge)數據集,是全球關于(yu)3D人體重建技術的(de)(de)(de)權威(wei)數據集。榜單中的(de)(de)(de)競(jing)爭(zheng)對手包(bao)括加(jia)州大學伯(bo)克(ke)利(li)分校(xiao)、賓夕(xi)法尼亞大學、Amazon和(he)Adobe Research等知(zhi)名企業(ye)、研究所與高校(xiao)。
那么(me),這(zhe)項“牛逼”的AI技(ji)術到底(di)有哪些應用呢?對于大(da)眾而言,3D人體重建技(ji)術帶(dai)來的是全新體驗:
這意(yi)味著(zhu),只用美(mei)顏APP就可以(yi)完成高(gao)精度的全(quan)身“瘦身”;你站(zhan)在鏡子前,商場的試衣(yi)鏡便可實(shi)現一(yi)秒換裝(zhuang);如果放(fang)在電影工業的范(fan)疇來看,全(quan)新的3D人體(ti)重建技術(shu),甚至將超越今(jin)年(nian)熱映好萊塢科幻(huan)大片《阿麗塔》中所(suo)使用的視(shi)覺特效(xiao)(xiao)水平(鈦媒體(ti)曾對該片的特效(xiao)(xiao)技術(shu)有詳(xiang)細介紹)。
在3D重建領域,重慶影視制作在的差(cha)通常被作為算法能力的主要衡(heng)量指標,它指的是生成模型與(yu)實際圖像的差(cha)別。一般來(lai)說誤(wu)差(cha)越(yue)低,精度(du)越(yue)高,技(ji)術(shu)的性能越(yue)好。
云從對鈦媒體透露,此次技(ji)術突(tu)破,“將原(yuan)有(you)最低誤(wu)差記錄大幅降低30%,使3D人體建模(mo)的結(jie)果更優秀,更接近人體的實際情(qing)況”。以(yi)下為云從提供的最低誤(wu)差記錄的信(xin)息:
全身(shen)精(jing)度(du)誤(wu)差在Surreal上(shang)從75.4毫米(mi)降(jiang)低(di)到52.7毫米(mi);關節(jie)精(jing)度(du)誤(wu)差從55.8毫米(mi)降(jiang)低(di)到40.1毫米(mi);Human3.6M上(shang)的關節(jie)精(jing)度(du)誤(wu)差從59.9毫米(mi)降(jiang)低(di)到46.7毫米(mi);
除了誤差指(zhi)標,流暢度也是評(ping)價技術效(xiao)果的(de)關鍵(jian)指(zhi)標。據(ju)云從透露,當(dang)前人體模(mo)型的(de)幀率已經達到(dao)了200幀/每秒(miao)(miao),相較之下,電(dian)影(ying)的(de)幀率通常只有24幀/秒(miao)(miao),即使對流暢度要求(qiu)很高的(de)電(dian)子游戲,達到(dao)60幀/秒(miao)(miao)就已經非常流暢。在運算速度上,人體建模(mo)的(de)耗時也從上百毫(hao)秒(miao)(miao)降低到(dao)5毫(hao)秒(miao)(miao),建模(mo)效(xiao)率更高。
關鍵指標取得重大突破,加速了3D人體重建的落地進程,但這一概念在大眾眼中實屬陌生。重慶3D動畫公司他們(men)所提出的單幀3D人體重(zhong)建到底是(shi)什么(me)?其革命性(xing)到底體現在哪里(li)?
2D向3D飛躍:更精(jing)細的人體重建(jian)
因為人體有豐富的姿態和穿著,云從提出了一套全新的基于人體3D縱深預測的3D信息表征方式。該重慶3D動畫制作技術(shu)通過對三原色圖像(xiang)(RGB,不含(han)深(shen)度信息(xi))進行分析,預測人體(ti)的3D形態和姿勢。
這是3D人體重建(jian)從2D時代向(xiang)3D時代的飛(fei)躍。
傳統的(de)(de)人體(ti)(ti)關(guan)鍵點(dian)檢測(ce)(ce)技術(shu)往(wang)(wang)往(wang)(wang)監測(ce)(ce)的(de)(de)是2D的(de)(de)人體(ti)(ti)骨(gu)骼關(guan)節(jie)點(dian),即通過技術(shu)預(yu)測(ce)(ce)RGB圖像中(zhong)人體(ti)(ti)的(de)(de)十幾個關(guan)節(jie)點(dian)的(de)(de)坐標。這(zhe)種方式存在著不足,其一(yi)這(zhe)樣(yang)捕捉的(de)(de)節(jie)點(dian)非(fei)常稀疏;其二,這(zhe)樣(yang)捕捉的(de)(de)結果一(yi)般只包含2D平面(mian)的(de)(de)坐標預(yu)測(ce)(ce),不能還原3D的(de)(de)深度信息,無(wu)法體(ti)(ti)現縱(zong)深感。
而(er)基于(yu)單幀(zhen)圖像的(de)3D重建技術不僅能輸(shu)出(chu)骨骼關(guan)(guan)節點(dian)信息,更能同時預(yu)測大量人(ren)體(ti)表面(mian)的(de)關(guan)(guan)鍵點(dian)信息,使預(yu)測結果更豐(feng)富。而(er)且每個(ge)點(dian)的(de)坐標都(dou)是3D呈(cheng)現,能夠體(ti)現不同軀干的(de)縱深信息。