精品日本一区二区三区免费,欧美一区1区三区3区公司,日韩av无码久久一区二,文中字幕一区二区三区视频播放

News Center

新聞中心

達晨領(lǐng)投3D大模型領(lǐng)軍企業(yè)VAST
發(fā)布日期:2024-09-19

以下文章來源于VAST AI ,作者Tripo2.0

666666.png

達晨完成對3D大模型領(lǐng)軍企業(yè)VAST新一輪融資的領(lǐng)投。近期,VAST連續(xù)完成了兩輪共計數(shù)億元的融資,天使輪由綠洲資本領(lǐng)投,Pre-A輪領(lǐng)投方為達晨財智以及春華創(chuàng)投,并創(chuàng)造了3D大模型賽道的最?融資?額。

同時,VAST全新的3D大模型Tripo 2.0也在今天與大家正式見面。


333666.png

| 關(guān)于VAST


VAST成?于2023年3?,是?家致?于通?3D大模型研發(fā)的AI公司,公司?標是通過打造?眾級別的3D內(nèi)容創(chuàng)作?具,建?3D的UGC內(nèi)容平臺,讓基于3D的空間成為??體驗、內(nèi)容表達、提升新質(zhì)?產(chǎn)?的關(guān)鍵要素。


2024年初,VAST推出數(shù)?億參數(shù)級別的3D?模型Tripo 1.0,8秒就可用圖/?生成3D?格模型,上線至今全球???成超過500萬個3D模型。


2024年3?,VAST與全球頂級開源社區(qū)Stability AI共同推出開源3D基礎(chǔ)模型TripoSR,該模型創(chuàng)造了0.5秒完成單圖?3D模型的頂尖表現(xiàn),?今仍是3D?成領(lǐng)域開源社區(qū)的熱?項?。


今天,VAST推出Tripo 2.0,驗證了3D大模型的Scaling Law,也將3D生成推向下一個里程碑。


Tripo 2.0采?了融合DiT和U-Net模型的復(fù)合架構(gòu),通過學(xué)習(xí)捕捉?規(guī)模數(shù)據(jù)中的?何和材質(zhì)分布,更好地保證了3D模型?何形狀的細節(jié)和材質(zhì)的輸出質(zhì)量。


Tipo 2.0能夠完成10秒?成形狀?何、10秒?成紋理及PBR,為3D?成領(lǐng)域設(shè)?了通?模型新的效果標準。 


據(jù)我們所知,Tripo在所有的3D生成任務(wù)的效果中均處于全球領(lǐng)先地位。

57908f5b391093bc8807ae876e9231c8.jpg


GPTEval3D:基于MLLM的評估指標(3D生成形狀、紋理質(zhì)量、細節(jié)表現(xiàn)、輸入條件遵循性、輸出多樣性),旨在評估生成的3D內(nèi)容的語義準確性和質(zhì)量

理解單個物體是理解世界的開始

對于創(chuàng)作3D內(nèi)容的用戶而言,文字輸入的生成方式提供了“言出法隨、創(chuàng)造世界”的可能,圖片輸入則提供更多創(chuàng)作過程中的可控性

與傳統(tǒng)3D重建的應(yīng)用場景不同,大部分純粹的創(chuàng)意概念可能超出了現(xiàn)實世界的物理限制。許多游戲、設(shè)計項目或虛擬場景中的3D內(nèi)容實際上也沒有現(xiàn)實中的實體。某些環(huán)境異常惡劣,即使投入大量資金購買先進的掃描設(shè)備,也無法掃描、修復(fù)或重建這些內(nèi)容。

因此,3D大模型對于文字生成復(fù)雜組合物體的能力、以及單圖輸入的空間理解及還原的能力,就成為評價體系中最為重要的考察標準。

對于Tripo而言,這意味著需要具備以下能力:

  • 第一是精準的語言理解能力,將用戶的文本輸入意圖準確地反映成物體的幾何結(jié)構(gòu)和組成細節(jié),還包括文本中各部分之間的空間關(guān)系;

  • 第二是對空間的深度和精確還原能力,確保從任意視角的單一圖片中準確推斷三維結(jié)構(gòu)和深度信息,精確還原復(fù)雜物體的幾何形狀和紋理細節(jié),并保持整體一致性;

  • 第三是對于物理規(guī)律和常識的理解能力,確保生成的內(nèi)容既符合用戶意圖,又在遵循基本物理法則的情況下保持邏輯一致性,使結(jié)果在創(chuàng)意自由度和現(xiàn)實合理性之間找到平衡;

這就是Tripo交出的答卷:見微知著,探索世界的背面。

比如“長著牙、拿著樹葉的葉子精怪”、“有番茄、生菜、胡蘿卜的菜籃”、“站在水面玻璃球上的火烈鳥”:

c90a0746c6f9bb8227226de00e8c8d59.jpg

466c26632eb45e5da86e01efcb7fa8ae.jpg

a03ee18c7a2362aaec5d94fe56656121.jpg

以上效果由www.tripo3d.ai 直出,均為AI生成3D模型的六視渲染圖

再以這張翡翠布花的圖片為例,左邊的花束與主干花束是黏連還是分開?葉片之間的重疊關(guān)系是什么?花束的背后是什么樣?

2222.png


再比如這艘船,桅桿的結(jié)構(gòu)是什么?船艙的結(jié)構(gòu)如何設(shè)計?


3333.png


除了精進的文本和視覺輸入理解能力之外,Tripo 2.0 的生成結(jié)果也擁有領(lǐng)先的質(zhì)量和保真度,在形狀和紋理質(zhì)量、細節(jié)表現(xiàn)都樹立了新的行業(yè)標準(new state-of-the-art)。

Tripo不僅能生成高度細致和準確的3D形狀,捕捉復(fù)雜的特征和幾何結(jié)構(gòu),還能生成高保真度的PBR(基于物理的渲染)材質(zhì),呈現(xiàn)出精細的表面屬性和逼真豐富的視覺效果。

999.png

以上效果由www.tripo3d.ai 直出

| 驗證3D生成的Scaling Law

VAST算法團隊始終在找尋3D生成領(lǐng)域的tokenizer,驗證3D生成領(lǐng)域的Scaling Law。

Tripo 2.0采用了融合DiT和U-Net模型的復(fù)雜混合架構(gòu)。這種融合充分發(fā)揮了兩種架構(gòu)的優(yōu)勢,一方面DiT擅長捕捉3D結(jié)構(gòu)中的全局上下文和長距離依賴關(guān)系,另一方面U-Net精于保留精細的細節(jié)和局部特征。同時利用海量高質(zhì)量3D數(shù)據(jù),輔以多種合成數(shù)據(jù)擴展技術(shù),這種設(shè)計不僅顯著提高了生成模型的質(zhì)量,還增強了模型的魯棒性、穩(wěn)健性和泛化能力。

工程優(yōu)化方面,團隊通過蒸餾提高效率:同時采用了guidance distillation和step distillation,在不犧牲質(zhì)量的前提下大幅優(yōu)化了性能(更多算法內(nèi)容請持續(xù)關(guān)注VAST AI后續(xù)的算法技術(shù)報告)。

在一年多的探索中,算法團隊不斷探索模型規(guī)模與性能關(guān)系,Tripo 2.0證實了隨著模型參數(shù)的增加和訓(xùn)練數(shù)據(jù)量的擴大,生成質(zhì)量呈現(xiàn)出可預(yù)測的提升。通過對單個物體的深入理解,Tripo 2.0不斷展示從微觀到宏觀的推理能力,這種"見微知著"的能力是構(gòu)建復(fù)雜3D世界的基石。

| 讓每個人成為超級創(chuàng)作者 

Tripo 2.0能夠完成10秒?成?何形狀,10秒?成紋理及PBR材質(zhì)。

這意味著Tripo不僅能在3D工業(yè)生產(chǎn)管線里降本增效,也為實時創(chuàng)作更多3D內(nèi)容和玩法提供未來的可能性。

VAST的創(chuàng)始人兼CEO宋亞宸表?:“?前我們有自信地對外宣布VAST和Tripo2.0在效果上已經(jīng)達到了 Midjourney V4的階段。這意味著??使?體驗的躍升和巨?的商業(yè)化潛?。感謝多?資本對VAST的?睞,讓我們能夠?qū)ξ磥淼?D?態(tài)持續(xù)探索。

技術(shù)??,我們會持續(xù)追尋3D?成式AI的Scaling Law, 研究模型規(guī)模、數(shù)據(jù)量和?成質(zhì)量之間關(guān)系的基本原理,尋找數(shù)據(jù)、表征和模型架構(gòu)的可擴展范式, 致?于推動3D?成式AI的邊界。也會不斷探索更整體的(Holistic)3D?成,不僅包括單個資產(chǎn)和道具、??的?成,也包含(動態(tài))環(huán)境、運動、物理等的探索。3D?成作為?模型領(lǐng)域的前沿新興分?,在游戲動畫影視、3D打印、互聯(lián)?及?業(yè)產(chǎn)品設(shè)計、具身智能、仿真模擬、MR、教育、空間智能等領(lǐng)域的2B及2C應(yīng)?展?出前所未有的想象?。我們相信通過更?眾級別的3D創(chuàng)作者?具和全?的3D內(nèi)容平臺,能夠打造出?個全新和繁榮的?成式3D?態(tài)?!?/span>

達晨投資團隊表示:“數(shù)千年來,人類文明的傳承方式主要是文字、圖像和模型。近幾年在人工智能的加持下,這些文明的表達方式發(fā)生了革命性變化。達晨在內(nèi)容生成方面已經(jīng)布局了大語言模型、文生圖、文生視頻等,而文生/圖生3D是“新文明”拼圖的最后一環(huán)。正如‘AI教母’李飛飛的觀點,人類是生活在3D世界中的,而人工智能要真正追上人類,必須突破3D的理解和生成。第一代互聯(lián)網(wǎng)主要基于語言的交互,第二代互聯(lián)網(wǎng)主要基于圖片和視頻的交互,下一代互聯(lián)網(wǎng)一定是3D內(nèi)容的交互,而面向C端的3D創(chuàng)作工具就成為了關(guān)鍵環(huán)節(jié)、重中之重。相比較VAST在2B方向?qū)τ趥鹘y(tǒng)建模師的幫助,我們更看好其在2C方向?qū)τ趶V大消費者生活方式的改變。試想一下,大到房屋家具、小到鞋包杯碗,身邊的物品都可以按照自己的心意來設(shè)計和制造,個性化將得到極大解放,每個人心中的創(chuàng)意都將得以展現(xiàn)。如果再配合上MR眼鏡,我們可以隨時隨地改造世界,在下一代互聯(lián)網(wǎng)中共享空間文明。”


1111.jpg

達晨成立于2000年4月19日,總部位于深圳,是我國第一批按市場化運作設(shè)立的本土創(chuàng)投機構(gòu)。自成立以來,達晨伴隨著中國經(jīng)濟的快速增長和多層次資本市場的不斷完善,在社會各界的關(guān)心和支持下,聚焦于信息技術(shù)、智能制造和節(jié)能環(huán)保、醫(yī)療健康、大消費和企業(yè)服務(wù)、文化傳媒、軍工等領(lǐng)域 … [ +更多 ]
微信公眾號

達晨財智創(chuàng)業(yè)投資管理有限公司 版權(quán)所有

Copyright © Fortune Venture Capital Co.Ltd. All rights reserved

電話:0755-83515108

郵箱:fortune@fortunevc.com

粵ICP備14030831號 技術(shù)支持:中網(wǎng)互聯(lián)

粵公網(wǎng)安備 44030402003598號