作者 | 林晴晴
編輯 | 彭孝秋
36 氪獲悉,人工智能芯片企業(yè)「凌川科技」近日完成數(shù)億元 A 輪融資,由北京市人工智能產(chǎn)業(yè)投資基金和快手集團(tuán)領(lǐng)投,亦莊產(chǎn)投、順禧基金、九智資本等跟投。本輪融資將主要用于下一代芯片研發(fā)、現(xiàn)有產(chǎn)品 SL200 的量產(chǎn)擴(kuò)產(chǎn)及海外市場拓展。
「凌川科技」成立于 2024 年 3 月,由北京市人工智能基金與快手集團(tuán)共同發(fā)起,前身為快手集團(tuán)異構(gòu)計(jì)算與芯片事業(yè)部。「凌川科技」CEO 劉凌志告訴 36 氪,"2018 年快手日活破億,傳統(tǒng)堆算力服務(wù)器的成本壓力已不可持續(xù)。我們從異構(gòu)計(jì)算平臺(tái)切入,2020 年正式立項(xiàng)芯片,2023 年 SL200 在快手部署數(shù)萬顆,節(jié)省超預(yù)期成本后,拆分獨(dú)立成為必然選擇。"
目前,SL200 芯片集成了視頻編碼、AI 推理、多核 CPU 等核心功能,部署量近數(shù)萬顆,服務(wù) 7 億用戶,并獲評(píng) 2023 世界互聯(lián)網(wǎng)大會(huì) " 創(chuàng)新發(fā)展典型案例 "。劉凌志強(qiáng)調(diào):" 互聯(lián)網(wǎng)基因讓我們從應(yīng)用反推芯片設(shè)計(jì),客戶需求直接定義產(chǎn)品,這是傳統(tǒng)芯片公司難以復(fù)制的優(yōu)勢。"
目前,全球 AI 芯片市場長期由英偉達(dá)主導(dǎo),其 CUDA 生態(tài)形成技術(shù)壁壘,但大模型推理場景對成本與能效的敏感度催生了 ASIC 架構(gòu)的差異化需求。國內(nèi)智能視頻賽道高速增長,涌現(xiàn)快手、字節(jié)跳動(dòng)等頭部應(yīng)用及 " 可靈 "" 即夢 " 等大模型技術(shù),但算力芯片仍面臨美國出口限制的 " 卡脖子 " 風(fēng)險(xiǎn)。「凌川科技」瞄準(zhǔn)垂直領(lǐng)域,通過 ASIC 架構(gòu)降低推理成本,單顆芯片可處理 36 路視頻任務(wù),較傳統(tǒng)方案節(jié)能 30%,成為國產(chǎn)替代的關(guān)鍵路徑。
36 氪了解到,SL200 芯片為國內(nèi)首款集成視頻編碼、AI 推理、多核 CPU 等功能的 ASIC 芯片,支持萬分之一超低故障率,頭部客戶直播覆蓋率近 100%。其視頻壓縮性能在 MSU 大賽中超越英特爾、英偉達(dá),單路處理成本降低 40%。下一代芯片針對大模型訓(xùn)練推理場景設(shè)計(jì),支持 LLM、文生圖、文生視頻、推薦算法等高算力需求,重點(diǎn)支持以快手可靈為代表的文生視頻模型。公司同步開發(fā)類 CUDA 編程接口,適配 PyTorch 框架及主流大模型推理引擎,降低客戶遷移成本。
「凌川科技」Transtreams Advanced Compute Unified Architecture 是一種融合 CPU 與 NPU 協(xié)同運(yùn)作的異構(gòu)運(yùn)算平臺(tái)。它結(jié)合傳統(tǒng) CUDA/OpenCL 優(yōu)勢,采用由 CPU 負(fù)責(zé)控制與調(diào)度、NPU 處理密集計(jì)算的架構(gòu),實(shí)現(xiàn)高效任務(wù)協(xié)同與性能優(yōu)化。其編程框架支持同一套代碼在 CPU 與 NPU 間無縫切換,TC 編譯器可根據(jù)負(fù)載自動(dòng)分配任務(wù),提升資源利用與負(fù)載平衡。在語言層面,TC 編程語言提供了對張量(Tensor)及其不同層次數(shù)據(jù)布局(layout)的統(tǒng)一表示,并抽象出面向 TC NPU 架構(gòu)的 Tiling 與 Pipeline 機(jī)制。語言級(jí)封裝使得開發(fā)者能夠簡潔、準(zhǔn)確地表達(dá)復(fù)雜的特殊 layout、跨層次 memory(如 DDR、SRAM)的排布,以及多核并行計(jì)算中的 Tiling 與流水線調(diào)度,從而減少程序開發(fā)中的錯(cuò)誤和復(fù)雜性,提高編程效率。同時(shí),運(yùn)算平臺(tái)提供了豐富的系統(tǒng)和應(yīng)用管理工具,方便用戶能夠更高效地進(jìn)行靈活的開發(fā)、驗(yàn)證、環(huán)境部署及質(zhì)量監(jiān)控等。
目前,SL200 芯片已覆蓋快手、阿里、百度等互聯(lián)網(wǎng)數(shù)據(jù)中心,并應(yīng)用在廣播電視、廣電領(lǐng)域、智慧城市、智能巡檢等場景,合作案例超 20 個(gè)。同時(shí),也與華為、超聚變、浪潮等廠商形成行業(yè)解決方案。此外,SL200 海外通過快手海外出海業(yè)務(wù)進(jìn)入東南亞新加坡、巴西市場。劉凌志透露:" 公司下一代芯片已與多家大模型公司完成適配測試,今明年將重點(diǎn)拓展自動(dòng)駕駛機(jī)器人、低空經(jīng)濟(jì)、自動(dòng)駕駛等機(jī)器人與邊緣計(jì)算場景。"
團(tuán)隊(duì)方面,「凌川科技」CEO 劉凌志為上海交大博士、華盛頓大學(xué)博士后,曾任快手副總裁及華為、英特爾核心技術(shù)管理崗。自拆分至今,團(tuán)隊(duì)規(guī)模已增長三倍,成員涵蓋芯片及互聯(lián)網(wǎng)行業(yè)專業(yè)人才。公司研發(fā)人員占比 80% 以上,70% 以上為碩士學(xué)歷,20% 以上為博士學(xué)歷,60% 的員工具有十年以上從業(yè)經(jīng)驗(yàn)。團(tuán)隊(duì)累計(jì)申請中外專利超百項(xiàng),涵蓋大模型壓縮、視頻編碼等關(guān)鍵技術(shù)。團(tuán)隊(duì)核心成員也深度參與 NeurIPS ’ 21 等國際競賽,并主導(dǎo)多項(xiàng)北京市、上海市 " 卡脖子 " 技術(shù)攻關(guān)項(xiàng)目。