中文字幕在线观看网址|激情av片在线免费观看|免费亚洲欧美视频|日本按摩高潮A级中文片不

  • <rt id="m2u44"><code id="m2u44"></code></rt>
    <dfn id="m2u44"></dfn>
  • <dfn id="m2u44"><source id="m2u44"></source></dfn>
  • <menu id="m2u44"></menu>
    
    
    關(guān)于ZAKER 合作
    量子位 前天

    Qwen3 真香!通義 App 滿(mǎn)血接入,一手實(shí)測(cè)在此

    開(kāi)源大模型新王者,正在受到空前關(guān)注。

    Qwen3 預(yù)告一出,直接開(kāi)啟不眠夜模式。

    來(lái)自編輯部本部

    等到深夜正式上線并宣布登頂全球最強(qiáng)開(kāi)源模型,更是瞬間引爆全網(wǎng)熱議。

    網(wǎng)友們的反應(yīng)在 meme 中盡數(shù)體現(xiàn)(doge)。

    畢竟,單看紙面參數(shù),Qwen3 就是個(gè)妥妥的大工程:

    8 款混合推理模型全部開(kāi)源,參數(shù)量從0.6B235B全面覆蓋;

    32B 模型就有超越 OpenAI o1、DeepSeek R1 的性能表現(xiàn),在編程基準(zhǔn)測(cè)評(píng)中還超過(guò)了風(fēng)頭正盛的 Gemini 2.5 Pro;

    支持思考和非思考模式,支持 119 種語(yǔ)言和方言、加強(qiáng)對(duì) MCP 支持……

    還有網(wǎng)友認(rèn)為,這是 " 又一個(gè) DeepSeek 時(shí)刻 "。

    這一次模型開(kāi)源,通義 App 和網(wǎng)頁(yè)版也趕在第一時(shí)間滿(mǎn)血上線 Qwen3,并且有專(zhuān)屬智能體體驗(yàn)。

    新王究竟表現(xiàn)如何,我們第一時(shí)間深度實(shí)測(cè),以見(jiàn)真章。

    Qwen3 住進(jìn) App,還能這樣玩兒

    打開(kāi)通義 App/ 通義網(wǎng)頁(yè)版首頁(yè),目前有兩種方式可以體驗(yàn)到 Qwen3 模型:

    直接用輸入框?qū)υ?huà)(代碼 / 數(shù)學(xué) / 翻譯類(lèi)問(wèn)題默認(rèn)調(diào)用 Qwen3-235B,其它問(wèn)題不調(diào)用 Qwen3)

    選用 " 千問(wèn)大模型 " 智能體(默認(rèn)使用旗艦版 Qwen3-235B-A22B)

    BTW,通義網(wǎng)頁(yè)版近期上線了新域名 tongyi.com,不要走錯(cuò)。

    OK,接下來(lái)進(jìn)入正題。

    官方強(qiáng)調(diào)了新模型在 Agent、編碼方面的能力提升,還增強(qiáng)了對(duì) MCP 的支持。具體表現(xiàn)如何,我們直接在通義 App里全方位實(shí)測(cè)。

    第一關(guān):代碼生成

    先來(lái)個(gè)新模型 " 入門(mén)挑戰(zhàn) " ——空間內(nèi)彈小球。

    這個(gè)經(jīng)典測(cè)試在考驗(yàn)?zāi)P痛a能力的同時(shí),還重點(diǎn)關(guān)注了它對(duì)物理世界的理解,幾乎每一個(gè)新模型都會(huì)被拉出來(lái)遛一遛。

    提示詞如下(p5.js 腳本、25 個(gè)粒子、圓柱形容器):

    而第一次接受挑戰(zhàn)的旗艦版 Qwen3 模型,用時(shí) 1 分鐘,唰唰唰就生成了一百多行代碼:

    將上述代碼實(shí)際運(yùn)行一下,結(jié)果 be like:

    雖然一眼看去沒(méi)有 " 小球直接沖出圓圈 " 這樣明顯的錯(cuò)誤,但也確實(shí)缺少 3D 空間感。

    作為對(duì)比,我們拉出官方測(cè)評(píng)圖中,和滿(mǎn)血 Qwen3 代碼實(shí)力最相近的 Grok 3 模型。

    重復(fù)相同操作,讓 Grok 3 基于同一提示詞生成代碼,并實(shí)際運(yùn)行:

    二者的區(qū)別相當(dāng)明顯,后者(Grok 3)的空間感肉眼可見(jiàn)更強(qiáng)。

    為了進(jìn)一步探究?jī)啥未a的差別,我們又直接讓 Qwen3" 自己找找差距 "(doge)。

    結(jié)果,它真的很認(rèn)真地進(jìn)行了全方位對(duì)比,包括渲染模式、容器結(jié)構(gòu)、粒子運(yùn)動(dòng)與碰撞測(cè)試等等。

    最終結(jié)論也用表格進(jìn)行了呈現(xiàn),一目了然:

    甚至,基于它提出的改進(jìn)意見(jiàn),我們繼續(xù)讓它出了一個(gè)新版本。

    實(shí)際運(yùn)行后,這次的結(jié)果已經(jīng)非常符合我們的要求了。

    事實(shí)上,深扒 Qwen3 的思考過(guò)程,我們才發(fā)現(xiàn)原來(lái)第一版的 2D 效果是它 " 深思熟慮 " 后的選擇。

    這里主要考慮到了兼容性問(wèn)題,所以簡(jiǎn)化成了俯視圖來(lái)呈現(xiàn)。

    從上面這個(gè)簡(jiǎn)單測(cè)試,我們已經(jīng)能夠窺見(jiàn) Qwen3 的程序員素養(yǎng)確實(shí)不錯(cuò)。

    接下來(lái)難度升級(jí),直接讓它幫打工人設(shè)計(jì)一個(gè)提醒喝水的電腦端 App。

    注意,為了能快速在瀏覽器端預(yù)覽生成效果,這里我們采用了 " 極簡(jiǎn)模式 ",僅保留最基礎(chǔ)的功能,不涉及使用任何第三方庫(kù)。

    結(jié)果生成的 App 有模有樣,還能真實(shí)點(diǎn)擊交互。

    一旦讓具備工程能力的童鞋們上手,估計(jì)能實(shí)現(xiàn)更多復(fù)雜效果。

    第二關(guān):邏輯推理

    接下來(lái)我們考查一下 Qwen3 的邏輯推理能力。

    老規(guī)矩,先上一道經(jīng)典邏輯陷阱題:

    農(nóng)夫要把一頭狼、一只羊和一盆菜帶過(guò)一條河。河邊只有一艘小船,農(nóng)夫每次只能帶一樣?xùn)|西過(guò)河。如果農(nóng)夫不在場(chǎng)時(shí),狼會(huì)吃羊,羊會(huì)吃菜。如何安排農(nóng)夫的安全過(guò)河方案?

    故意關(guān)閉聯(lián)網(wǎng)模式后,Qwen3 經(jīng)過(guò)一步步推理最終給出了正確答案。

    農(nóng)夫應(yīng)按照以下順序操作:

    帶羊過(guò)河,返回。

    帶狼過(guò)河,帶回羊。

    帶白菜過(guò)河,返回。

    帶羊過(guò)河。

    此方案通過(guò) 7 次移動(dòng)(4 次過(guò)河,3 次返回),確保所有物品安全抵達(dá)對(duì)岸。

    而且從 Qwen3 的思考過(guò)程能夠看到,其思維方式和人類(lèi)一樣,是通過(guò)不斷推翻各種方案來(lái)找出可行路徑。

    再來(lái)一道超高難度專(zhuān)業(yè)數(shù)學(xué)題。

    原題來(lái)自今年的普特南數(shù)學(xué)競(jìng)賽,該競(jìng)賽號(hào)稱(chēng)最難本科數(shù)學(xué)考試,人類(lèi)要考 6 小時(shí),并且所選取的題目據(jù)稱(chēng)前 500 名選手均未能完整作答。

    而扔給 Qwen3 后,可以看到整體的思考時(shí)間確實(shí)明顯變長(zhǎng),最終用時(shí)5 分 38 秒給出了正確答案。

    p.s. 千問(wèn)智能體無(wú)法直接上傳圖片,最終選擇從 App 首頁(yè)上傳圖片,提取文字后繼續(xù)使用千問(wèn)智能體作答。

    更有趣的是,扒一扒其思考過(guò)程,還能看到模型在線表演 " 崩潰 ":

    當(dāng)然,雖然 AI 的解讀速度和正確率明顯勝于人類(lèi),但還是要和同類(lèi)來(lái)比。

    在國(guó)外網(wǎng)友的測(cè)試中,同一道題 Grok 3(Think)在約 8 分鐘內(nèi)找到了解決方案。

    所以對(duì)比下來(lái),這一局算 Qwen3 略勝一籌。

    第三關(guān):多語(yǔ)言能力

    另外據(jù)介紹,Qwen3 的一大亮點(diǎn)是支持 119 種語(yǔ)言和方言,被網(wǎng)友戲稱(chēng) "AI 屆多鄰國(guó) "(doge)。

    別的不說(shuō),直接讓它來(lái)挑戰(zhàn)一把國(guó)內(nèi)專(zhuān)業(yè)譯者的地位試試。

    將莎士比亞《哈姆雷特》的經(jīng)典選段丟給它,讓它按照 " 信達(dá)雅 " 翻譯成中文。

    它還知道參考優(yōu)秀譯本,并且注意避免直接抄襲造成侵權(quán)。

    最終生成的結(jié)果如下(左側(cè)),對(duì)比我們熟知的朱生豪經(jīng)典譯本(右側(cè)),你覺(jué)得 AI 味兒濃度如何?

    第四關(guān):賽博閨蜜、shopping 比價(jià)、寫(xiě)歌一網(wǎng)打盡

    除了以上更側(cè)重模型基礎(chǔ)能力的考查,當(dāng) Qwen3 被塞進(jìn) App 后,我們還解鎖了更多玩法。

    做旅游規(guī)劃這種就不必多說(shuō)了,關(guān)鍵還能充當(dāng) " 賽博閨蜜 ",幫忙選擇更適合發(fā)朋友圈的游客照。

    日常也能用來(lái)購(gòu)物比價(jià),比如分析出當(dāng)下最值得入手的 3000 元預(yù)算內(nèi)平板。

    不僅用表格清晰列出了各品牌的核心參數(shù),還按照不同需求進(jìn)行了推薦,一整個(gè)造福伸手黨。

    此外,最近火上熱搜的 "AI 寫(xiě)歌 ",我們也用 Qwen3 嘗試了一把。

    五一版 · 大張偉嗨歌這就新鮮出爐,光看歌詞確實(shí)有內(nèi)味兒了:

    Okk,以上為我們的全部實(shí)測(cè)。

    小結(jié)一下,通過(guò)在通義 App 使用 Qwen3 專(zhuān)屬智能體,我們能明顯感受到以下幾點(diǎn):

    Qwen3 旗艦?zāi)P偷纳伤俣确浅??,體驗(yàn)很絲滑;

    模型擅長(zhǎng)推理,能夠解決經(jīng)典邏輯陷阱和復(fù)雜數(shù)學(xué)題;

    代碼能力方面,已經(jīng)能夠快速實(shí)現(xiàn)一些簡(jiǎn)單需求;

    由于載體是 App,可拓展的玩法很多。

    而且,通義 App 自上個(gè)月頁(yè)面改版后,整體設(shè)計(jì)更簡(jiǎn)潔,交互也更加完善了。

    更多網(wǎng)友實(shí)測(cè)

    與此同時(shí),隨著 Qwen3 模型的爆火,更多網(wǎng)友也第一時(shí)間進(jìn)行了試玩。

    有和 " 空間內(nèi)彈小球 " 類(lèi)似效果的頁(yè)面設(shè)計(jì):

    還有用阿拉伯語(yǔ)、法語(yǔ)和印地語(yǔ)解釋愛(ài)因斯坦相對(duì)論的玩法,該博主聲稱(chēng):

    簡(jiǎn)單到連十歲的小孩都能理解。

    當(dāng)然,大家一直尤為鐘愛(ài)的小游戲開(kāi)發(fā)也安排上了:

    開(kāi)源界的新王者

    Qwen3 引發(fā)熱議背后,可以看到的是,在開(kāi)源影響力上,以 Qwen 為代表的國(guó)產(chǎn)大模型,已經(jīng)有超越 Llama 之勢(shì)。

    這一點(diǎn),從 reddit LocalLLaMA 等開(kāi)發(fā)者聚集的板塊的最新話(huà)題中,亦可見(jiàn)一斑。

    不僅是基準(zhǔn)評(píng)測(cè)數(shù)據(jù)的紙面超越,實(shí)測(cè)越多,模型實(shí)力究竟幾何就越能被客觀公允地認(rèn)知。

    而如今的開(kāi)源格局之變,并非一蹴而就。前有 DeepSeek,今有 Qwen3,背后體現(xiàn)的是來(lái)自中國(guó)的開(kāi)源力量一以貫之的努力,和一如既往的" 中國(guó)速度 "。

    以 Qwen 為例:

    2024 年 11 月底,開(kāi)源推理模型 QwQ;

    2025 年春節(jié)檔,連發(fā) Qwen2.5 百萬(wàn)上下文版本、視覺(jué)理解模型 Qwen2.5-VL,還有超大規(guī)模 MoE 模型 Qwen-2.5 Max;

    2025 年 3 月,QwQ-32B 以 1/10 成本比肩 DeepSeek-R1;

    多模態(tài)方面,還有萬(wàn)相 Wan 的持續(xù)開(kāi)源和迭代……

    這還只是短短 5 個(gè)月內(nèi)的進(jìn)展。

    再加上更加開(kāi)放和商用友好的 Apache 2.0 協(xié)議,開(kāi)發(fā)者們的轉(zhuǎn)向,自然在情理之中。

    作為普通用戶(hù),一方面,可以在通義 App 這樣的官方應(yīng)用上更快感知到滿(mǎn)血模型的能力。

    另一方面,也可以期待開(kāi)源,帶來(lái)更多衍生應(yīng)用的可能性。

    那么,再次打開(kāi)傳送門(mén):

    tongyi.com

    如果你探索到了什么新鮮玩法,也歡迎在評(píng)論區(qū)跟大家分享 ~

    參考鏈接:

    [ 1 ] https://x.com/YUEXINWANG61157/status/1917059240360919318

    [ 2 ] https://x.com/kis/status/1917090589931409750

    [ 3 ] https://x.com/godofprompt/status/1917147674438255021

    一鍵三連「點(diǎn)贊」「轉(zhuǎn)發(fā)」「小心心」

    歡迎在評(píng)論區(qū)留下你的想法!

    點(diǎn)亮星標(biāo)

    科技前沿進(jìn)展每日見(jiàn)

    相關(guān)標(biāo)簽

    相關(guān)閱讀

    最新評(píng)論

    沒(méi)有更多評(píng)論了