浙江杭州,這個看似平凡的辦公空間里,隱藏著另一個世界——機(jī)器人的數(shù)字訓(xùn)練場。這里是群核科技,創(chuàng)業(yè)14年,因在空間智能領(lǐng)域積累了不容忽視的優(yōu)勢,不僅躋身“杭州六小龍”之列,在國際上也有著舉足輕重的地位。
物理AI可以理解為懂物理規(guī)則的人工智能。只有懂了物理規(guī)則,自主機(jī)器如機(jī)器人、自動駕駛汽車等,才能在真實(shí)的物理世界中進(jìn)行感知、理解和執(zhí)行復(fù)雜操作。
黃曉煌,群核科技的聯(lián)合創(chuàng)始人兼董事長。解釋物理AI、空間智能以及如何訓(xùn)練機(jī)器人時(shí),他需要不斷地通俗一點(diǎn),不斷地舉例說明。在杭州六小龍爆火之前,他很少在媒體上露面,本質(zhì)上他是一個技術(shù)癡迷者。
相比于理解訓(xùn)練機(jī)器人這件事,理解群核科技的創(chuàng)業(yè)過程要簡單很多。

2007年,黃曉煌從浙江大學(xué)竺可楨學(xué)院畢業(yè),因?yàn)楂@得英偉達(dá)全額獎學(xué)金,赴美國伊利諾伊大學(xué)厄巴納-香檳分校攻讀博士學(xué)位,研究方向是用GPU(圖形處理器)做高性能計(jì)算。還沒完成學(xué)業(yè),他就加入了英偉達(dá),主要工作是給GPU芯片開發(fā)并行計(jì)算的編程框架以及CUDA的開發(fā)。但僅僅1年后,他做出了離開英偉達(dá)的決定。

2011年,在主流觀點(diǎn)中,英偉達(dá)仍是一家“消費(fèi)電子硬件公司”。盡管當(dāng)時(shí)杰弗里·辛頓已經(jīng)在用英偉達(dá)的GPU訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),但大多數(shù)人尚未意識到GPU的并行計(jì)算能力將成為未來人工智能爆發(fā)的算力基石。

在這樣一個時(shí)間節(jié)點(diǎn)上,黃曉煌看到的是GPU的超級算力和云端部署相結(jié)合的潛力。他邀請一樣來自浙江大學(xué)的陳航以及來自清華大學(xué)的朱皓,共同創(chuàng)業(yè)。創(chuàng)業(yè)方向,是用GPU做云端的圖形圖像快速渲染。渲染,指的是通過算法將三維模型或場景轉(zhuǎn)換為二維圖像或視頻的過程。
在很短的時(shí)間里,年輕的創(chuàng)始團(tuán)隊(duì)用低價(jià)顯卡集合成一個端云協(xié)同的高性能GPU集群,算力成本大幅降低,并實(shí)現(xiàn)了更快的計(jì)算速度。但那時(shí),投資圈熱門的概念仍是移動互聯(lián)網(wǎng),黃曉煌在硅谷融資時(shí),無一例外都遭到了拒絕。在最困難的時(shí)期,恰逢浙江省到硅谷招商引資,黃曉煌和伙伴們決定回國創(chuàng)業(yè)。

2012年,辛頓帶領(lǐng)學(xué)生在圖像識別大賽中用深度卷積神經(jīng)網(wǎng)絡(luò)碾壓傳統(tǒng)算法,開啟了AI革命的新篇章,GPU也因此一戰(zhàn)成名。通過與亞馬遜的合作,英偉達(dá)開始進(jìn)入“云服務(wù)”的戰(zhàn)場。彼時(shí),群核科技的年輕團(tuán)隊(duì)正奔跑在用錘子找釘子的路上。他們的錘子是利用GPU實(shí)現(xiàn)“物理正確”的渲染引擎,“物理正確”是指渲染出的圖在各種參數(shù)上與真實(shí)的物理世界相一致。
黃曉煌:我在英偉達(dá)工作的時(shí)候,整個公司的方法論都是先把技術(shù)做出來,然后花各種成本去找應(yīng)用。所以我受到了這種方法論的熏陶,說白了就是拿著錘子找釘子,需要先把錘子造出來。

這把錘子可以用來做電影特效渲染,但收回成本的時(shí)間太長,也可以用于游戲行業(yè),但當(dāng)時(shí)的手游對畫質(zhì)的要求并不高。最終,他們的技術(shù)落錘在了家裝行業(yè)。
然而,隨著用戶規(guī)模的擴(kuò)大,對黃曉煌他們來說,技術(shù)挑戰(zhàn)也呈指數(shù)級上升。

2013年,群核科技推出了主打產(chǎn)品“酷家樂”,這款空間設(shè)計(jì)軟件憑借其10秒快速渲染的能力一炮而紅,吸引了大量的設(shè)計(jì)師,成為大家居行業(yè)首選的設(shè)計(jì)軟件。
家裝行業(yè)背后的產(chǎn)業(yè)鏈和數(shù)據(jù)規(guī)模的擴(kuò)大,讓黃曉煌和團(tuán)隊(duì)很自然地把技術(shù)優(yōu)勢延伸到工業(yè)4.0。物理正確的數(shù)據(jù)讓設(shè)計(jì)圖能直接對接工廠生產(chǎn),而這一步,又帶來更多的數(shù)據(jù)沉淀。
2018年,基于自身業(yè)務(wù)海量的室內(nèi)空間數(shù)據(jù)積累,群核科技聯(lián)合國內(nèi)外幾所高校共同推出InteriorNet數(shù)據(jù)集。在此之前,國際上已經(jīng)有不少知名數(shù)據(jù)集存在,但多數(shù)為靜態(tài)或不可交互數(shù)據(jù),InteriorNet是少有的由可交互三維數(shù)據(jù)構(gòu)成的數(shù)據(jù)集,也是全球最大的室內(nèi)場景認(rèn)知深度學(xué)習(xí)數(shù)據(jù)集。最重要的是,它是免費(fèi)開源的數(shù)據(jù)集。
數(shù)據(jù)集開放后不久,群核科技就收到了一封來自硅谷某科技巨頭的電子郵件,希望和他們進(jìn)行合作。
當(dāng)時(shí),該科技巨頭正苦于缺乏大量物理正確的合成數(shù)據(jù)做機(jī)器人訓(xùn)練,這次合作,讓群核科技的數(shù)據(jù)集第一次應(yīng)用在了空間智能訓(xùn)練上。

在現(xiàn)實(shí)世界中訓(xùn)練機(jī)器人,成本高昂、難以擴(kuò)展,而使用數(shù)據(jù)訓(xùn)練機(jī)器人,則面臨高質(zhì)量3D數(shù)據(jù)稀缺的瓶頸。合成數(shù)據(jù)因此是一種性價(jià)比更高且潛力無限的訓(xùn)練數(shù)據(jù)來源。群核科技推出的數(shù)據(jù)集被帝國理工學(xué)院、南加州大學(xué)、浙江大學(xué)等多所高校采用,成為室內(nèi)AI視覺訓(xùn)練中具有代表性的基礎(chǔ)設(shè)施之一。


2025年3月,群核科技發(fā)布并開源了自主研發(fā)的空間理解模型SpatialLM,結(jié)合之前發(fā)布的空間智能平臺SpatialVerse,可以讓機(jī)器人完成從認(rèn)知理解到行動交互的完整閉環(huán)訓(xùn)練。隨著具身智能的爆發(fā)式增長,群核科技有了新的可能,就是成為空間智能訓(xùn)練的“云端基礎(chǔ)設(shè)施巨頭”之一。

記者:某種程度上,你就像ChatGPT這樣的公司。
黃曉煌:是的,但它們是封閉的,我們是開放的。
記者:你的開放和他們的封閉,會帶來什么樣的不一樣?
黃曉煌:我看重的是未來10年、20年后我們的業(yè)務(wù),我們先把基礎(chǔ)設(shè)施鋪好,真正的能力才能得到發(fā)揮。我覺得對于中國這一代企業(yè)家來說,擁抱開源能夠發(fā)揮更大價(jià)值。
記者:所以這又回到你創(chuàng)業(yè)的初衷、驅(qū)動力是什么?
黃曉煌:我們一直堅(jiān)信,只要你的技術(shù)有價(jià)值,然后這個賽道蓬勃發(fā)展,你在里面一定能夠分到一杯羹。而且你得感興趣,即使失敗了,這個過程你也會很開心、很有成就感,即使沒賺到錢,也會覺得不枉此行。