編者按:AI產(chǎn)業(yè)邁入Token經(jīng)濟(jì)新時(shí)代,算力基礎(chǔ)設(shè)施成為產(chǎn)業(yè)落地與價(jià)值流轉(zhuǎn)的核心樞紐。啟明創(chuàng)投投資企業(yè)無(wú)問(wèn)芯穹作為AGI基建賽道的標(biāo)桿企業(yè),近期完成超7億元新一輪融資,累計(jì)融資超22億元。創(chuàng)業(yè)邁入穩(wěn)步落地期的同時(shí),公司錨定“最高效Token工廠”全新定位,跳出單一AI加速服務(wù)商視角,以多元異構(gòu)、軟硬協(xié)同的技術(shù)路徑,打通國(guó)產(chǎn)與海外算力混合調(diào)度難題,重塑AI基礎(chǔ)設(shè)施效能評(píng)價(jià)標(biāo)準(zhǔn)。站在產(chǎn)業(yè)現(xiàn)金流閉環(huán)與供需格局變革關(guān)口,未來(lái)Token用量將持續(xù)高增、漲價(jià)周期將至,疊加各種模型生態(tài)賦能,國(guó)產(chǎn)算力正加速駛?cè)肷虡I(yè)化主航道,中國(guó)也有望依托能源與產(chǎn)業(yè)鏈優(yōu)勢(shì),成長(zhǎng)為全球AI Token生產(chǎn)高地。無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪預(yù)判:“過(guò)去Made in China是制造業(yè),現(xiàn)在是AI Made in China。”
本文為《中國(guó)企業(yè)家》對(duì)夏立雪的獨(dú)家專訪,深度拆解公司技術(shù)布局、商業(yè)模式與行業(yè)大勢(shì)研判。

對(duì)比前兩年的艱難摸索,最近一年,無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪創(chuàng)業(yè)進(jìn)入到了“低阻力超音速”的狀態(tài)。
“前兩年,Token規(guī)模尚未真正起量,我們要面對(duì)方向選擇、節(jié)奏布局等沒(méi)有標(biāo)準(zhǔn)答案的難題?,F(xiàn)在賽道和需求都比之前清晰了,雖然不確定性依然在,但不一樣的是,很多事情開(kāi)始能落地、能衡量了。最初的判斷正一點(diǎn)一點(diǎn)被驗(yàn)證,能朝著明確的目標(biāo)全力跑起來(lái),這已經(jīng)是非常理想的創(chuàng)業(yè)節(jié)奏。”
5月7日,啟明創(chuàng)投投資企業(yè)、AGI基礎(chǔ)建設(shè)服務(wù)商無(wú)問(wèn)芯穹宣布,公司獲得超7億元融資。
夏立雪接受《中國(guó)企業(yè)家》獨(dú)家專訪時(shí)表示:“公司從2025年下半年就啟動(dòng)了這輪融資。當(dāng)時(shí),我們認(rèn)為模型能力突破了商業(yè)化的臨界點(diǎn),大模型正從好技術(shù)到好產(chǎn)品,再到好產(chǎn)業(yè)轉(zhuǎn)化。我們當(dāng)時(shí)就預(yù)判,應(yīng)該要儲(chǔ)備更多彈藥。”
夏立雪判斷,AI產(chǎn)業(yè)已進(jìn)入現(xiàn)金流閉環(huán)階段。企業(yè)賺取的收入可重新投入生產(chǎn),制造并輸出高價(jià)值的Token,再通過(guò)商業(yè)化變現(xiàn)形成持續(xù)回款,實(shí)現(xiàn)可盈利、可循環(huán)、可擴(kuò)張的成熟產(chǎn)業(yè)鏈。
而在整個(gè)AI產(chǎn)業(yè)鏈中,Infra層起著關(guān)鍵作用,它是整合芯片與能源的“Token工廠”,涵蓋數(shù)據(jù)中心、冷卻系統(tǒng)、網(wǎng)絡(luò)架構(gòu)等硬件設(shè)施,也是英偉達(dá)CEO黃仁勛所提出的五層蛋糕——能源、芯片、基礎(chǔ)設(shè)施(Infrastructure)、模型、應(yīng)用中的關(guān)鍵一層。
夏立雪認(rèn)為,在供小于求的市場(chǎng)里,算力可能長(zhǎng)時(shí)間供給不足。“不是最有錢的人就能占領(lǐng)最高的行業(yè)地位,而是最懂得做好優(yōu)化的人。”
無(wú)問(wèn)芯穹上一次融資是在6個(gè)月前,2025年11月,公司完成了5億元A+輪融資。再向前追溯,2024年8月宣布完成近5億元A輪融資,加上天使輪,無(wú)問(wèn)芯穹公開(kāi)披露的累計(jì)融資,已經(jīng)超過(guò)22億元。

無(wú)問(wèn)芯穹成立于2023年5月,發(fā)起人是清華大學(xué)電子工程系教授汪玉,夏立雪、聯(lián)合創(chuàng)始人兼首席科學(xué)家戴國(guó)浩、首席技術(shù)官李伯勛都曾是汪玉的學(xué)生。
汪玉在2025年9月的一次演講中提到,如何優(yōu)化單位能耗下的Token效率,將是AI 2.0時(shí)代基礎(chǔ)設(shè)施與系統(tǒng)設(shè)計(jì)的核心命題。評(píng)價(jià)基礎(chǔ)設(shè)施效能的核心指標(biāo)已經(jīng)發(fā)生了變化——傳統(tǒng)的“每焦耳能量所能支持的計(jì)算次數(shù)(TOPS/J)”正被“每焦耳能量所能處理的有效Token數(shù)量(Tokens/J)”所取代。
無(wú)問(wèn)芯穹將目標(biāo)鎖定為打造“最高效的Token工廠”,以及成為Token經(jīng)濟(jì)樞紐。這個(gè)定位比之前公司提出的“AI加速”和“送鏟人”更為清晰聚焦。
面對(duì)國(guó)產(chǎn)芯片與海外高端算力并存、性能與生態(tài)參差不齊的行業(yè)現(xiàn)實(shí),無(wú)問(wèn)芯穹走出了一條以多元異構(gòu)、軟硬協(xié)同、自主化AI為核心的獨(dú)特路徑。目前,無(wú)問(wèn)芯穹平臺(tái)已接入包括Kimi、智譜、DeepSeek、通義千問(wèn)、MiniMax等在內(nèi)的頭部大模型。
夏立雪坦言,國(guó)產(chǎn)芯片不必追求一步到位替代海外方案,而是要邊跑邊改、邊用邊優(yōu)。真正的效率突破,是把不同算力放在最擅長(zhǎng)的位置。
無(wú)問(wèn)芯穹通過(guò)異構(gòu)混訓(xùn)混推,實(shí)現(xiàn)了英偉達(dá)與國(guó)產(chǎn)芯片的混合使用,把大模型的預(yù)填充與解碼、訓(xùn)練與推理、復(fù)雜算子與常規(guī)計(jì)算合理拆分,讓每一分算力都實(shí)現(xiàn)了價(jià)值最大化。這得以讓大模型廠商在逐步提升國(guó)產(chǎn)芯片承載比例的同時(shí),不必?fù)p失3~6個(gè)月的迭代周期。
以Token為中心的商業(yè)模式正在讓整個(gè)AI產(chǎn)業(yè)感到興奮。對(duì)此,夏立雪提供了幾個(gè)關(guān)鍵數(shù)據(jù):第一,去年底至今年4月底,無(wú)問(wèn)芯穹MaaS平臺(tái)模型推理的Token用量以20倍速增長(zhǎng),并且增長(zhǎng)量主要來(lái)自大規(guī)模商業(yè)化以及智能水平最好的模型。
第二,未來(lái)6個(gè)月,Token的使用量將供不應(yīng)求,并會(huì)保持這種增速。
第三,Token漲價(jià)潮即將到來(lái)。夏立雪說(shuō):“漲價(jià)和成本降低這兩件事情疊加起來(lái),你就會(huì)發(fā)現(xiàn)這是一個(gè)盈虧平衡線的問(wèn)題:Token價(jià)格上漲、同時(shí)成本降低,會(huì)使得原本某些領(lǐng)域虧本的生意變成賺錢。所以,AI最終的盈虧平衡線是能夠在更多場(chǎng)合內(nèi)取得正向收益。一旦取得正向收益,供需的飛輪就會(huì)轉(zhuǎn)起來(lái)。”
DeepSeek-V4的發(fā)布,也讓這條路徑迎來(lái)關(guān)鍵拐點(diǎn)。V4發(fā)布的Pro與Flash雙版本,兼顧了極致性能與普惠成本,為國(guó)產(chǎn)芯片提供了規(guī)模落地的最佳載體。
夏立雪認(rèn)為,DeepSeek真正的價(jià)值,不僅是對(duì)硬件友好的優(yōu)化,更是用開(kāi)源生態(tài)與分層產(chǎn)品策略,把國(guó)產(chǎn)芯片真正帶入商業(yè)化主航道。更多國(guó)產(chǎn)芯片有望被高效激活、規(guī)?;褂谩⒊掷m(xù)迭代。
他預(yù)判,憑借電力、模型性價(jià)比等因素,中國(guó)未來(lái)會(huì)成為全世界的“Token生產(chǎn)工廠”?!斑^(guò)去Made in China是制造業(yè),現(xiàn)在是AI Made in China?!?/strong>
以下為對(duì)話精選,啟明創(chuàng)投微信公眾號(hào)經(jīng)授權(quán)轉(zhuǎn)載。
01/
行業(yè)仍在10倍速增長(zhǎng)
《中國(guó)企業(yè)家》:作為產(chǎn)業(yè)上下游中間的Infra層,你預(yù)計(jì)今年的競(jìng)爭(zhēng)是不是會(huì)格外激烈,會(huì)不會(huì)淘汰幾家?
夏立雪:我認(rèn)為不是。一個(gè)產(chǎn)業(yè)如果要淘汰公司,核心原因是需求飽和,從而出現(xiàn)白熱化競(jìng)爭(zhēng)。但目前AI產(chǎn)業(yè)需求非但沒(méi)有飽和,還在大量增長(zhǎng),對(duì)上下游都有帶動(dòng)。既然整個(gè)產(chǎn)業(yè)都有更大的蛋糕可以切,中間任何一個(gè)階段、任何一個(gè)層次,都會(huì)有更大的市場(chǎng)可以分。
具體到Infra這個(gè)賽道,它的價(jià)值是把底層資源發(fā)揮出更大的產(chǎn)能。如果現(xiàn)在國(guó)內(nèi)的芯片夠用了,才能談得上飽和。但現(xiàn)在和未來(lái)很長(zhǎng)一段時(shí)間,都是極度緊缺的狀態(tài)。
黃仁勛在演講中描述的基礎(chǔ)設(shè)施,被他放入了“能源、芯片、基礎(chǔ)設(shè)施、模型、應(yīng)用”五層蛋糕體系內(nèi)。大家能感受到這是一個(gè)萬(wàn)億級(jí)的市場(chǎng),我們?cè)诶锩孀龅角|、百億的收入,都是很不錯(cuò)的狀態(tài)。
現(xiàn)在更多的關(guān)注點(diǎn),應(yīng)該是自己的技術(shù)能不能進(jìn)一步做好、能不能提供產(chǎn)業(yè)價(jià)值、客戶認(rèn)不認(rèn)可我們的價(jià)值,以及能不能持續(xù)推出更好的產(chǎn)品迭代。這幾件事情遠(yuǎn)比競(jìng)爭(zhēng)關(guān)系重要得多。
《中國(guó)企業(yè)家》:所以AI Infra行業(yè)還是一個(gè)你追我趕的馬拉松式競(jìng)爭(zhēng)?
夏立雪:現(xiàn)在可能還談不上競(jìng)爭(zhēng)。蛋糕足夠大,隨便圈一塊地,都可以先蓋起一座自己的城市。大家都還在選擇做哪一塊市場(chǎng),遠(yuǎn)沒(méi)到需要拼刺刀的階段。

《中國(guó)企業(yè)家》:在整個(gè)Infra層,無(wú)問(wèn)芯穹相比于競(jìng)爭(zhēng)對(duì)手,核心價(jià)值點(diǎn)在哪里?
夏立雪:在今天這個(gè)時(shí)間點(diǎn),占據(jù)最高行業(yè)地位的不是最有錢的人,而是最懂得做好優(yōu)化的人。
Token工廠的底層邏輯,就是對(duì)每單位資源所生產(chǎn)的Token,以及每Token所帶來(lái)的生產(chǎn)力水平,進(jìn)行優(yōu)化。因此,我們一直是按照技術(shù)價(jià)值和產(chǎn)業(yè)價(jià)值打通的方式來(lái)做Infra。
在黃仁勛的AI產(chǎn)業(yè)五層結(jié)構(gòu)中,基礎(chǔ)設(shè)施立足在中間層,向上需要把算法和應(yīng)用的know-how、業(yè)務(wù)的流量、尺寸和分布,都納入到優(yōu)化空間內(nèi);向下要把芯片結(jié)構(gòu),甚至能源建設(shè)都納入考慮。所以基礎(chǔ)設(shè)施是一個(gè)非常需要全棧技術(shù)能力的層次。
我們有很強(qiáng)的算法團(tuán)隊(duì),也有很強(qiáng)的偏硬件團(tuán)隊(duì),既能把算法中最好、最重要的計(jì)算保留下來(lái),又讓這些計(jì)算能絲滑地跑在硬件最擅長(zhǎng)的結(jié)構(gòu)上。這兩者之間的打通,是Infrastructure最核心的競(jìng)爭(zhēng)力,也是無(wú)問(wèn)芯穹在行業(yè)里最獨(dú)特的一點(diǎn)。
我們從成立最開(kāi)始就立足軟硬協(xié)同、多元異構(gòu)的核心技術(shù),做M種模型和N種芯片之間的聯(lián)合優(yōu)化,這些都是在宣告我們的立場(chǎng):要把每一塊芯片上的每一分算力、每一秒鐘都?jí)赫サ綐O致,這就是我們?yōu)檫@個(gè)行業(yè)帶來(lái)的價(jià)值。
《中國(guó)企業(yè)家》:一家國(guó)產(chǎn)大模型廠商說(shuō),算法迭代如果要適配國(guó)產(chǎn)芯片,至少要損失3到6個(gè)月的時(shí)間?;趪?guó)產(chǎn)算力、異構(gòu)芯片,你們?cè)趺慈ケM量彌補(bǔ)這個(gè)時(shí)間差,做到性能先進(jìn)或者效率先進(jìn)?
夏立雪:最重要的是把任務(wù)做合理的分工和拆解。以DeepSeek-V4為例,它有Pro和Flash(專業(yè)和快速)兩個(gè)版本,參數(shù)量分別是1.6T和284B,面向不同的應(yīng)用場(chǎng)景,有不同分工。
我們做多元異構(gòu),除了把A國(guó)產(chǎn)芯片和B國(guó)產(chǎn)芯片混在一起,更重要的是能夠把國(guó)產(chǎn)芯片和英偉達(dá)芯片也混在一起。它們之間也形成分工,從又大又重、對(duì)算子庫(kù)、性能、帶寬都要求拉滿的任務(wù)中,拆出國(guó)產(chǎn)芯片能夠承擔(dān)的子任務(wù);而國(guó)產(chǎn)芯片暫時(shí)還不擅長(zhǎng)、需要花一些時(shí)間才能應(yīng)對(duì)的復(fù)雜任務(wù),交給英偉達(dá)芯片處理。
我們之前還做過(guò)更難的事情:把訓(xùn)練任務(wù)也拆開(kāi),讓兩種芯片配合起來(lái)完成訓(xùn)練,混合下來(lái)的折損率在3%以下,達(dá)到97.6%的混合訓(xùn)練效率。
現(xiàn)在,我們能把大模型的推理,比如Prefill(預(yù)填充)和Decode(解碼),拆在兩種不同的芯片上,去做異構(gòu)PD分離。
這就是無(wú)問(wèn)芯穹的價(jià)值:通過(guò)拆解任務(wù),讓每份算力做最擅長(zhǎng)的事情,不讓用戶“等”。對(duì)大模型來(lái)說(shuō),“等”是一個(gè)很可怕的機(jī)會(huì)成本,只要不讓它等,就能邊跑邊改。
《中國(guó)企業(yè)家》:邊跑邊改會(huì)不會(huì)影響客戶體驗(yàn)?
夏立雪:首先要讓客戶從體感上,認(rèn)知到國(guó)產(chǎn)芯片是能用的。邊跑邊改之后,才有改的方向,因?yàn)門oken工廠本身有很重要的飛輪:運(yùn)行的業(yè)務(wù)越多,越能發(fā)現(xiàn)里面的優(yōu)化空間。
對(duì)我們來(lái)說(shuō),整個(gè)Token工廠的價(jià)值,就是積累了更好的優(yōu)化之后,提供更具性價(jià)比的Token。讓更多的人來(lái)用,飛輪就轉(zhuǎn)起來(lái)了。
所以,國(guó)產(chǎn)芯片的生態(tài)閉環(huán)非常重要。無(wú)問(wèn)芯穹提供的核心價(jià)值,是我們通過(guò)對(duì)任務(wù)進(jìn)行拆分,打通芯片之間的通信庫(kù),讓芯片的容錯(cuò)、SLA(服務(wù)等級(jí))能夠穩(wěn)定達(dá)到可用,最后再統(tǒng)一交付。
《中國(guó)企業(yè)家》:你怎么評(píng)價(jià)DeepSeek-V4的發(fā)布?
夏立雪:首先,它是相當(dāng)好用的開(kāi)源模型,DeepSeek繼續(xù)把開(kāi)源模型的生態(tài)體系推廣下去,未來(lái)一定能看到更多應(yīng)用在開(kāi)源生態(tài)中爆發(fā)。
其次,V4模型有相當(dāng)多的優(yōu)化技術(shù),也兼顧了硬件友好。比如它對(duì)Cache(緩存)的一些優(yōu)化做得很好,使得用當(dāng)前的硬件也可以去支撐非常長(zhǎng)的Token上下文。未來(lái)Token使用量還會(huì)進(jìn)一步快增長(zhǎng),對(duì)Infra層也帶來(lái)了更多的需求。
第三,同時(shí)發(fā)布Pro和Flash兩個(gè)模型,是健康的模型規(guī)劃。更大尺寸的Pro模型,追求AGI的實(shí)現(xiàn);好用,但成本又沒(méi)那么高的Flash模型,可以更好地把國(guó)產(chǎn)芯片用起來(lái)。
用戶也是用腳投票的,DeepSeek之所以會(huì)花精力發(fā)布Flash模型,他們一定是發(fā)現(xiàn)了這個(gè)版本也能滿足很多行業(yè)的需求。這意味著整個(gè)AI賽道都在走向更健康的狀態(tài),不再只有最尖端的模型大家才愿意用,200B量級(jí)的模型也有很多人愿意用。
02/
讓國(guó)產(chǎn)芯片最高效率產(chǎn)生Token
《中國(guó)企業(yè)家》:無(wú)問(wèn)芯穹正在打造最高效的“Token工廠”,你們之前是AI加速、所謂的“賣鏟子”,這是不是一個(gè)定位的升級(jí)?
夏立雪:我不知道“升級(jí)”這個(gè)詞算不算重,但我們核心技術(shù)的內(nèi)核沒(méi)有變化,一直都在研究怎么把每一分算力的價(jià)值發(fā)揮到極致。
更多從業(yè)者在訓(xùn)模型的時(shí)期,我們提供的是怎么把已有資源用得更好,更像是“遞鏟子”的工作。
現(xiàn)在,技術(shù)本身的目標(biāo)沒(méi)有變,但業(yè)務(wù)發(fā)生了變化,產(chǎn)品形式和商業(yè)模式也會(huì)隨之自然轉(zhuǎn)化:大量需求來(lái)自Agent和各行各業(yè)的客戶。在這個(gè)時(shí)間點(diǎn),只提供“發(fā)動(dòng)機(jī)”,客戶不一定能組裝成最好的“流水線”,倒不如由我們把整條“流水線”搭起來(lái)。
既然Token已經(jīng)是有量、能定價(jià)、有一定標(biāo)準(zhǔn)化趨勢(shì)的商品形態(tài),那我們完全可以利用自己的技術(shù)優(yōu)勢(shì),向市場(chǎng)提供最高效的優(yōu)質(zhì)Token產(chǎn)能。

《中國(guó)企業(yè)家》:現(xiàn)在,你們最大的目標(biāo)指引是不是Token?
夏立雪:是Token的生產(chǎn)效率和Token產(chǎn)生的價(jià)值,最典型的目標(biāo)就是Token/秒。我們也在嘗試用各種各樣的方法,讓Token/秒這個(gè)指標(biāo)變得更好,所有的優(yōu)化最后都可以回到這里。
算子優(yōu)化直接提升了芯片上每秒產(chǎn)生的Token;穩(wěn)定性優(yōu)化、運(yùn)維工作最后也都是為了提升Token/秒。
我們之所以使用各類異構(gòu)芯片,也是為了讓“Token/秒”的資源系數(shù)變得更大,讓更多的芯片貢獻(xiàn)到“Token/秒”中。一句話描述:讓中國(guó)所有能被用起來(lái)的芯片,都能以最高的效率去產(chǎn)生Token,這就是我們當(dāng)前最重要的目標(biāo)。
我們也在投入一部分精力,幫助那些對(duì)Token還用得沒(méi)有最高效,但有很好的創(chuàng)意和產(chǎn)品能力的中小創(chuàng)業(yè)者:他們可以用我們的工具把從Token到生產(chǎn)力的環(huán)節(jié)做好,讓他們把百分百的精力,花在釋放Token生產(chǎn)力,推出自己的產(chǎn)品上。
《中國(guó)企業(yè)家》:前段時(shí)間,你們還推出了一個(gè)龍蝦盒子,打造企業(yè)級(jí)的Token工廠。龍蝦盒子相較于市面上其他部署方案,在降低Token成本、提高產(chǎn)出效率方面解決了哪些痛點(diǎn)?
夏立雪:龍蝦盒子是一種產(chǎn)品形式,目前還在早期階段,我們更關(guān)注的是技術(shù)價(jià)值的內(nèi)核。這個(gè)產(chǎn)品最重要的一點(diǎn)是,它反映了我們最終解決的是Token到生產(chǎn)力的轉(zhuǎn)化效率。這涉及不同模型之間的配合,以及在不同數(shù)據(jù)域之間的安全性問(wèn)題。
龍蝦盒子最核心的賣點(diǎn),聚焦于“每Token所釋放生產(chǎn)力”的優(yōu)化目標(biāo)上。因?yàn)門oken可以分層,一部分任務(wù)用最強(qiáng)的模型,另一部分任務(wù)用更具性價(jià)比的模型。盒子可以用來(lái)跑小模型,重點(diǎn)解決的是數(shù)據(jù)傳輸時(shí)的安全問(wèn)題。
這件事既能用在終端的龍蝦盒子上——它針對(duì)的痛點(diǎn)是數(shù)據(jù)不想上傳到云端。未來(lái)也可以用在另一種場(chǎng)景——云上跑大模型,同時(shí)配合小集群,所以它更多代表我們?cè)诩夹g(shù)路線上的新布局和突破。
我們之前提過(guò)“異構(gòu)、異域和異屬”,一網(wǎng)三異。異構(gòu)解決的是同一個(gè)集群中如果有兩種不同的芯片,怎么一起跑。異域解決的是跨越一定距離(最遠(yuǎn)可達(dá)4000公里)的兩個(gè)集群,怎么一起跑。異屬解決的是兩種不同數(shù)據(jù)區(qū)內(nèi)的資源,怎么一起跑。龍蝦盒子,也是這個(gè)技術(shù)路線的落地。
《中國(guó)企業(yè)家》:阿里、字節(jié)、騰訊都成立了Token的部門,你們內(nèi)部團(tuán)隊(duì)會(huì)有這種專門的Token團(tuán)隊(duì)嗎?
夏立雪:我在很早期提過(guò)一個(gè)概念,叫“模力資源部”,參照“人力資源部”的思路,因?yàn)槲磥?lái)AI就是人的擴(kuò)展。目前,公司內(nèi)部用AI寫代碼這件事,基本上已經(jīng)是100%覆蓋;我們也在用AI做運(yùn)維;甚至內(nèi)部還有幫大家用AI畫PPT的工具。
現(xiàn)在有不少公司存在專門負(fù)責(zé)AI應(yīng)用的部門,考核指標(biāo)可能是公司和員工每天的Token使用量。雖然有點(diǎn)矯枉過(guò)正,最終不一定就是這種形態(tài),但在早期完全可以先按這種方式跑起來(lái)。
《中國(guó)企業(yè)家》:你提到,過(guò)去每?jī)芍芫蜁?huì)翻倍Token的使用量,那未來(lái)一年或者未來(lái)幾年都會(huì)保持這個(gè)增長(zhǎng)趨勢(shì)嗎?
夏立雪:調(diào)用量現(xiàn)在還是被供給卡住了。以后Token調(diào)用量增長(zhǎng),代表了用戶對(duì)Token性價(jià)比的接受度,或者供給成本下降的速度。
未來(lái)3到6個(gè)月,大概率還會(huì)保持當(dāng)前這樣的供需狀態(tài);6個(gè)月后,可能會(huì)有一波新的Token用量爆發(fā)。這是因?yàn)楣┙o能力有望大幅擴(kuò)充:既包括新結(jié)構(gòu)的國(guó)產(chǎn)芯片,也包括從模型到硬件的聯(lián)合優(yōu)化。此時(shí),Token性價(jià)比和技術(shù)優(yōu)化空間,也都會(huì)同步變大,這既讓可用的資源增多,也讓更精尖的芯片,有更高性價(jià)比的Token產(chǎn)出率。
就像之前的流量時(shí)代,用戶從每個(gè)月花幾百兆流量到用上幾個(gè)G流量,但花的錢并沒(méi)有增加10倍。Token用量增長(zhǎng),也帶來(lái)了整個(gè)產(chǎn)業(yè)的繁榮,成本也會(huì)持續(xù)顯著下降。
《中國(guó)企業(yè)家》:你們內(nèi)部怎么評(píng)價(jià)Token的指標(biāo)?是看使用量、看數(shù)量規(guī)模,看它的增速,還是看它帶來(lái)的客戶付費(fèi)?哪個(gè)才是AI Infra公司價(jià)值的第一指標(biāo)?
夏立雪:不同階段指標(biāo)肯定不一樣。在快速增長(zhǎng)的階段,高價(jià)值Token用量的規(guī)模,是最重要的。同時(shí),萬(wàn)億參數(shù)模型大概率還是挺貴的,這代表Token和基礎(chǔ)設(shè)施產(chǎn)生了對(duì)行業(yè)有價(jià)值、有回報(bào)的輸出。
用量越大,能看到的優(yōu)化空間越多;優(yōu)化技術(shù)如果不錯(cuò),就能產(chǎn)生更好的性價(jià)比,用量就會(huì)進(jìn)一步增加,從而產(chǎn)生飛輪效應(yīng)。
作為CEO,我更關(guān)注公司運(yùn)轉(zhuǎn)得好不好,看的是技術(shù)深度和客戶認(rèn)可度:能不能在技術(shù)主導(dǎo)的賽道保持最先進(jìn)的領(lǐng)先地位,客戶是不是認(rèn)可我們的產(chǎn)品價(jià)值。外化的指標(biāo),是高價(jià)值模型的付費(fèi)量或者調(diào)用量。
《中國(guó)企業(yè)家》:從你們平臺(tái)上Token使用量的增速來(lái)看,主要來(lái)自哪些行業(yè)客戶、哪些場(chǎng)景?智能體的貢獻(xiàn)大概占比多少?
夏立雪:95%以上都是智能體產(chǎn)生的。所屬行業(yè)也很豐富,其中寫代碼占大頭,還有內(nèi)容創(chuàng)意生成等。
03/
中國(guó)將成為Token世界工廠
《中國(guó)企業(yè)家》:現(xiàn)在大家都在說(shuō)Token漲價(jià)這件事情,你覺(jué)得Token應(yīng)該漲價(jià)嗎?或者你們覺(jué)得它應(yīng)該怎么去定價(jià)?
夏立雪:多數(shù)國(guó)內(nèi)模型的價(jià)格水平和漲幅都低于海外模型,但智能性已經(jīng)不錯(cuò)了,所以漲價(jià)空間是有的。
更重要的是,漲價(jià)背后的邏輯是用戶付費(fèi)意愿——漲完之后還有人愿意買,這才是剛需。
漲價(jià)和成本降低這兩件事疊加起來(lái),是盈虧平衡線的移動(dòng),原本某些領(lǐng)域虧本的生意變成賺錢,緊接著就會(huì)進(jìn)入供需增長(zhǎng)飛輪,最終給用戶帶來(lái)實(shí)惠。

《中國(guó)企業(yè)家》:你會(huì)覺(jué)得長(zhǎng)期來(lái)看Token會(huì)不會(huì)產(chǎn)能過(guò)剩,或者Token太多市場(chǎng)上消化不了,導(dǎo)致新一輪的價(jià)格戰(zhàn)?會(huì)有這樣一個(gè)拐點(diǎn)嗎?
夏立雪:未來(lái)Token會(huì)分層。一層是更優(yōu)質(zhì)的、產(chǎn)生更大價(jià)值的Token,另一層可能是白熱化競(jìng)爭(zhēng)、追求極致性價(jià)比的Token。這很像互聯(lián)網(wǎng)廣告流量,最終都按CPM(千人成本)計(jì)費(fèi),大家了解哪些渠道的曝光更值錢。Token經(jīng)濟(jì)在這方面更明確,因?yàn)槟P椭悄苄运?,就體現(xiàn)在Token質(zhì)量上。
我們作為Infra廠商看到的是,優(yōu)質(zhì)Token未來(lái)還是嚴(yán)重供不應(yīng)求。全世界都這樣,在中國(guó),稀缺度其實(shí)更高。
《中國(guó)企業(yè)家》:3月底的時(shí)候,昆侖萬(wàn)維創(chuàng)始人周亞輝對(duì)我們說(shuō),移動(dòng)互聯(lián)網(wǎng)的CPM在十年間是漲的,獲客成本越來(lái)越高,可能漲了10倍。在這個(gè)Token時(shí)代也可能是這樣——Token的成本看起來(lái)越來(lái)越低,但可能價(jià)格也會(huì)相對(duì)應(yīng)地漲10倍。
夏立雪:CPM漲,核心是因?yàn)閺V告投放平臺(tái)推出了以ROI為目標(biāo)的優(yōu)化模型,能“保轉(zhuǎn)化”。
Token也一樣。未來(lái)定價(jià)可能按照模型類型分層,也可能按照Token的輸入輸出,甚至按SLA分層定價(jià)。但本質(zhì)上都是為Token所產(chǎn)生的轉(zhuǎn)化價(jià)值去分層。既然它轉(zhuǎn)化為生產(chǎn)力的價(jià)值更高了,Token本身價(jià)值就更高,價(jià)格也可以更高。
《中國(guó)企業(yè)家》:你曾提到過(guò),中國(guó)未來(lái)會(huì)成為世界的Token工廠——過(guò)去Made in China是制造業(yè),現(xiàn)在是AI Made in China。
夏立雪:中國(guó)擁有豐沛的能源結(jié)構(gòu)優(yōu)勢(shì)、完整的AI產(chǎn)業(yè)鏈和全球最大規(guī)模的AI應(yīng)用市場(chǎng),完全有能力復(fù)刻“Made in China”的成功路徑。
以終為始,既然價(jià)值存在,所需要解決的就是方式、方法和鏈路的問(wèn)題。
《中國(guó)企業(yè)家》:有些人說(shuō),電力就是算力、電力即Token。你會(huì)怎么評(píng)價(jià)這個(gè)觀點(diǎn)?
夏立雪:未來(lái)在穩(wěn)定的狀態(tài)下,確實(shí)如此。比如芯片選型中,至少幾家芯片廠商都有了可觀的市場(chǎng)份額。此時(shí)意味著建設(shè)“Token工廠”,主要成本是原材料,而不是“房子”。
英偉達(dá)還是太貴了,相當(dāng)于“房子”是拿金磚蓋的,電的優(yōu)化價(jià)值還沒(méi)有完全凸顯。但再過(guò)兩年左右,“房子”的成本會(huì)變得可控,那時(shí)評(píng)價(jià)Token工廠的生產(chǎn)效率,看的一定是“原材料”到“成品”的轉(zhuǎn)化效率。
因此,未來(lái)電的成本以及電到Token的轉(zhuǎn)化率會(huì)變得更關(guān)鍵。中國(guó)在能源方面的優(yōu)勢(shì),一定會(huì)在全球展現(xiàn)出巨大的行業(yè)價(jià)值。
記者| 閆俊文
編輯|何伊凡
見(jiàn)習(xí)編輯|李原