中文字幕在线观看网址|激情av片在线免费观看|免费亚洲欧美视频|日本按摩高潮A级中文片不

  • <rt id="m2u44"><code id="m2u44"></code></rt>
    <dfn id="m2u44"></dfn>
  • <dfn id="m2u44"><source id="m2u44"></source></dfn>
  • <menu id="m2u44"></menu>
    
    
    關(guān)于ZAKER 合作
    鈦媒體 21分鐘前

    不到 15 萬元!清華 90 后團隊發(fā)布“褐蟻”一體機,已支持阿里最新 Qwen3 模型

    行云集成電路創(chuàng)始人、CEO 季宇

    4 月 30 日消息,鈦媒體 AGI 獲悉,清華 90 后創(chuàng)立的北京行云集成電路有限公司(簡稱 " 行云集成電路 ")宣布,推出全新的一體機產(chǎn)品 " 褐蟻 ",僅需最高 15 萬元就可以跑滿血版 DeepSeek R1/V3 大模型,并且對話速度達到了 20token/s。

    今天下午,行云集成電路創(chuàng)始人、CEO 季宇對鈦媒體 AGI 表示,目前 " 褐蟻 " 一體機已經(jīng)支持阿里最新發(fā)布的 Qwen3 系列開源大模型,包括頂配版 Qwen3-235B-A22B。

    具體來說," 褐蟻 " 一體機有三款不同的配置:最高性價比的 " 超大杯 " 褐蟻 HY90,搭載雙路 AMD EPYC 9355 服務(wù)器、24 條 48G 6400M 頻率內(nèi)存和 NV 5090D 計算卡,支持 FP8、INT4 兩種數(shù)據(jù)精度,在 FP8 精度下跑滿血版 DS 能達到 21token/s 的對話速度,在 INT4 精度下則能達到 28token/s,最高支持 128K 的上下文,售價 14.9 萬元;此外,行云集成電路還將推出 " 大杯 " 褐蟻 HY70、" 中杯 " 褐蟻 HY50 兩個配置版本。

    季宇團隊表示,行云通過對推理引擎的獨家優(yōu)化提升了推理效率,是國內(nèi)首個在 10 萬價位提供滿血 FP8 精度模型 20+tps 速率的一體機產(chǎn)品,并且可配置各類調(diào)用大模型 API 的應用。

    據(jù)悉,行云集成電路成立于 2023 年 8 月,其核心團隊主要來自清華大學及全球頂尖芯片公司,致力于研發(fā)下一代針對大模型推理場景的高效能 GPU 芯片,創(chuàng)始人包括季宇,以及公司 CTO 余洪敏。

    其中,31 歲的季宇是清華大學物理本科、計算機體系結(jié)構(gòu)方向博士,也是 " 華為天才少年 " 之一,主攻體系結(jié)構(gòu)、AI 芯片方向。而在華為期間,季宇曾是海思昇騰芯片編譯器專家,負責多個昇騰編譯器項目,同時作為研究科學家,展開 AI 編譯器領(lǐng)域和處理器微架構(gòu)域諸多挑戰(zhàn)性問題攻關(guān);類腦計算機體系結(jié)構(gòu)《自然》論文共同一作,中國計算機學會 CCF 優(yōu)博獎獲得者。

    2024 年 11 月,行云集成電路宣布完成總額數(shù)億元的天使輪及天使 + 輪融資,投資方包括智譜 AI、仁愛集團、中科創(chuàng)星、奇績創(chuàng)壇、水木清華校友基金、嘉御資本、春華資本、同創(chuàng)偉業(yè)、峰瑞資本等機構(gòu)。

    季宇早前表示,當機器的門檻低到消費級可以接受的成本,邊際成本承擔的商業(yè)模型也會發(fā)生變化,帶來進一步的產(chǎn)業(yè)繁榮。如果計算機體系能支撐消費級可以接受的價格享受極致的 AI 體驗,大模型產(chǎn)業(yè)會進一步進入一個類似軟件行業(yè)零邊際成本的超高速爆發(fā)期。

    事實上,目前多家芯片、服務(wù)器、云計算、運營商、AI Infra 等領(lǐng)域的公司都發(fā)布了 DeepSeek 一體機產(chǎn)品,堪稱 " 百機大戰(zhàn) ",但其中可以運行滿血版 DeepSeek-V3/R1 模型的企業(yè)并不多,目前國產(chǎn) GPU 芯片層面主要有壁仞科技、摩爾線程等。

    據(jù)第一財經(jīng)引述券商數(shù)據(jù),預計到 2027 年,國內(nèi)一體機的市場規(guī)模將超過 5000 億元,超過 30 家企業(yè)已向市場推出了一體機產(chǎn)品。

    一位行業(yè)人士早前對鈦媒體 AGI 表示,一體機核心解決的是部署易用性問題。相比復雜的云計算解決方案,項目落地周期更快、私有化安全性更高、價格更有性價比,但 DeepSeek 一體機比較大的問題在于持續(xù)維護、升級以及大規(guī)模數(shù)據(jù)調(diào)度等,以及一體機綜合使用成本沒有辦法復用。

    " 從當年數(shù)據(jù)庫年代,一體機就興起,這個大家非常喜歡,但不同的一體機,里面的東西差別是非常大的。DeepSeek 出來以后,DeepSeek 一體機爆火,我跟一些領(lǐng)導也聊過,數(shù)據(jù)中心算力這塊賣得特別好,但都是短期租賃,因為本身硬件固定資產(chǎn)的年限也就 4 到 5 年。所以,我們可以看到一體機比較大的問題是以后持續(xù)性的維護、升級以及大規(guī)模數(shù)據(jù)調(diào)度等,比如 DeepSeek 一體機是很新鮮,但是大模型演進非???,現(xiàn)在 DeepSeek 已經(jīng)不是最領(lǐng)先的了,其他公司也能升上去,而客戶本身可能根本沒有這方面的技術(shù)能力。" 上述人士表示,推理一體機只是過渡態(tài)產(chǎn)品,最終大模型還是要和云計算進行結(jié)合,當整個技術(shù)成熟以后,跟多云整合,最后會變成云平臺的一部分。

    對此,在季宇看來,現(xiàn)在一體機依然能夠跑得動超大杯的 MoE 模型和 30b 當量的 dense 模型,后續(xù)模型迭代其實還好。據(jù)悉,相比其他一體機產(chǎn)品,行云集成電路的 " 褐蟻 " 在顯存、KTransformers 等層面有更多的技術(shù)研發(fā)能力。

    據(jù)鈦媒體 AGI 了解,下一步,行云集成電路將自研 GPU 卡,持續(xù)帶來更低價格,更高 tps 體驗,并且還將實施由 30 臺褐蟻一體機組成的 " 蟻群 " 方案,進一步發(fā)揮分布式系統(tǒng)優(yōu)化能力,或?qū)⒅С?500-1000 的有效并發(fā)數(shù),而價格有望降至 300 萬 -400 萬元——低于英偉達 HGX H200 集群的整體硬件成本。

    鈦媒體 AGI 分析認為,從整個商業(yè)市場的視角來看,當前國內(nèi)有很多人都投身于一體機、AI Infra,以及 GPU 服務(wù)器等類似算力 " 賣水人 " 工作。隨著推理模型技術(shù)迅猛發(fā)展,大規(guī)模算力投入被質(zhì)疑,所以國內(nèi) AI 算力行業(yè)是否將如同 AGI 基座模型市場一般,經(jīng)歷大浪淘沙后最終僅剩下大廠及頭部的幾家企業(yè),還是說依然會有更多人 " 卷 " 性價比,這一點仍有待進一步觀察。

    根據(jù)規(guī)劃,季宇的最終目標是:為 AI 構(gòu)建 x86,目標是讓 AI PC 與互聯(lián)網(wǎng)底座重回組裝機模式(PC 及服務(wù)器),將組裝機打造成 AI 基座,低成本搭建高端大模型,激活 AI 服務(wù)器組裝機體系,讓大家能組裝出支撐高端 AI 應用的設(shè)備,帶動體系運轉(zhuǎn)。

    (本文首發(fā)于鈦媒體 App,作者|林志佳)

    相關(guān)標簽

    最新評論

    沒有更多評論了

    覺得文章不錯,微信掃描分享好友

    掃碼分享

    熱門推薦

    查看更多內(nèi)容