中文字幕在线观看网址|激情av片在线免费观看|免费亚洲欧美视频|日本按摩高潮A级中文片不

<rt id="m2u44"><code id="m2u44"></code></rt>

<dfn id="m2u44"></dfn>

<dfn id="m2u44"><source id="m2u44"></source></dfn>

<menu id="m2u44"></menu>

<strike id="0c6p0"><samp id="0c6p0"></samp></strike>

<li id="0c6p0"><abbr id="0c6p0"><table id="0c6p0"></table></abbr></li>

量子位前天

Qwen3 真香！通義 App 滿(mǎn)血接入，一手實(shí)測(cè)在此

開(kāi)源大模型新王者，正在受到空前關(guān)注。

Qwen3 預(yù)告一出，直接開(kāi)啟不眠夜模式。

△來(lái)自編輯部本部

等到深夜正式上線并宣布登頂全球最強(qiáng)開(kāi)源模型，更是瞬間引爆全網(wǎng)熱議。

網(wǎng)友們的反應(yīng)在 meme 中盡數(shù)體現(xiàn)（doge）。

畢竟，單看紙面參數(shù)，Qwen3 就是個(gè)妥妥的大工程：

8 款混合推理模型全部開(kāi)源，參數(shù)量從0.6B到235B全面覆蓋；

32B 模型就有超越 OpenAI o1、DeepSeek R1 的性能表現(xiàn)，在編程基準(zhǔn)測(cè)評(píng)中還超過(guò)了風(fēng)頭正盛的 Gemini 2.5 Pro；

支持思考和非思考模式，支持 119 種語(yǔ)言和方言、加強(qiáng)對(duì) MCP 支持……

還有網(wǎng)友認(rèn)為，這是 " 又一個(gè) DeepSeek 時(shí)刻 "。

這一次模型開(kāi)源，通義 App 和網(wǎng)頁(yè)版也趕在第一時(shí)間滿(mǎn)血上線 Qwen3，并且有專(zhuān)屬智能體體驗(yàn)。

新王究竟表現(xiàn)如何，我們第一時(shí)間深度實(shí)測(cè)，以見(jiàn)真章。

Qwen3 住進(jìn) App，還能這樣玩兒

打開(kāi)通義 App/ 通義網(wǎng)頁(yè)版首頁(yè)，目前有兩種方式可以體驗(yàn)到 Qwen3 模型：

直接用輸入框?qū)υ?huà)（代碼 / 數(shù)學(xué) / 翻譯類(lèi)問(wèn)題默認(rèn)調(diào)用 Qwen3-235B，其它問(wèn)題不調(diào)用 Qwen3）

選用 " 千問(wèn)大模型 " 智能體（默認(rèn)使用旗艦版 Qwen3-235B-A22B）

BTW，通義網(wǎng)頁(yè)版近期上線了新域名 tongyi.com，不要走錯(cuò)。

OK，接下來(lái)進(jìn)入正題。

官方強(qiáng)調(diào)了新模型在 Agent、編碼方面的能力提升，還增強(qiáng)了對(duì) MCP 的支持。具體表現(xiàn)如何，我們直接在通義 App里全方位實(shí)測(cè)。

第一關(guān)：代碼生成

先來(lái)個(gè)新模型 " 入門(mén)挑戰(zhàn) " ——空間內(nèi)彈小球。

這個(gè)經(jīng)典測(cè)試在考驗(yàn)?zāi)Ｐ痛a能力的同時(shí)，還重點(diǎn)關(guān)注了它對(duì)物理世界的理解，幾乎每一個(gè)新模型都會(huì)被拉出來(lái)遛一遛。

提示詞如下（p5.js 腳本、25 個(gè)粒子、圓柱形容器）：

而第一次接受挑戰(zhàn)的旗艦版 Qwen3 模型，用時(shí) 1 分鐘，唰唰唰就生成了一百多行代碼：

將上述代碼實(shí)際運(yùn)行一下，結(jié)果 be like：

雖然一眼看去沒(méi)有 " 小球直接沖出圓圈 " 這樣明顯的錯(cuò)誤，但也確實(shí)缺少 3D 空間感。

作為對(duì)比，我們拉出官方測(cè)評(píng)圖中，和滿(mǎn)血 Qwen3 代碼實(shí)力最相近的 Grok 3 模型。

重復(fù)相同操作，讓 Grok 3 基于同一提示詞生成代碼，并實(shí)際運(yùn)行：

二者的區(qū)別相當(dāng)明顯，后者（Grok 3）的空間感肉眼可見(jiàn)更強(qiáng)。

為了進(jìn)一步探究?jī)啥未a的差別，我們又直接讓 Qwen3" 自己找找差距 "（doge）。

結(jié)果，它真的很認(rèn)真地進(jìn)行了全方位對(duì)比，包括渲染模式、容器結(jié)構(gòu)、粒子運(yùn)動(dòng)與碰撞測(cè)試等等。

最終結(jié)論也用表格進(jìn)行了呈現(xiàn)，一目了然：

甚至，基于它提出的改進(jìn)意見(jiàn)，我們繼續(xù)讓它出了一個(gè)新版本。

實(shí)際運(yùn)行后，這次的結(jié)果已經(jīng)非常符合我們的要求了。

事實(shí)上，深扒 Qwen3 的思考過(guò)程，我們才發(fā)現(xiàn)原來(lái)第一版的 2D 效果是它 " 深思熟慮 " 后的選擇。

這里主要考慮到了兼容性問(wèn)題，所以簡(jiǎn)化成了俯視圖來(lái)呈現(xiàn)。

從上面這個(gè)簡(jiǎn)單測(cè)試，我們已經(jīng)能夠窺見(jiàn) Qwen3 的程序員素養(yǎng)確實(shí)不錯(cuò)。

接下來(lái)難度升級(jí)，直接讓它幫打工人設(shè)計(jì)一個(gè)提醒喝水的電腦端 App。

注意，為了能快速在瀏覽器端預(yù)覽生成效果，這里我們采用了 " 極簡(jiǎn)模式 "，僅保留最基礎(chǔ)的功能，不涉及使用任何第三方庫(kù)。

結(jié)果生成的 App 有模有樣，還能真實(shí)點(diǎn)擊交互。

一旦讓具備工程能力的童鞋們上手，估計(jì)能實(shí)現(xiàn)更多復(fù)雜效果。

第二關(guān)：邏輯推理

接下來(lái)我們考查一下 Qwen3 的邏輯推理能力。

老規(guī)矩，先上一道經(jīng)典邏輯陷阱題：

農(nóng)夫要把一頭狼、一只羊和一盆菜帶過(guò)一條河。河邊只有一艘小船，農(nóng)夫每次只能帶一樣?xùn)|西過(guò)河。如果農(nóng)夫不在場(chǎng)時(shí)，狼會(huì)吃羊，羊會(huì)吃菜。如何安排農(nóng)夫的安全過(guò)河方案？

在故意關(guān)閉聯(lián)網(wǎng)模式后，Qwen3 經(jīng)過(guò)一步步推理最終給出了正確答案。

農(nóng)夫應(yīng)按照以下順序操作：

帶羊過(guò)河，返回。

帶狼過(guò)河，帶回羊。

帶白菜過(guò)河，返回。

帶羊過(guò)河。

此方案通過(guò) 7 次移動(dòng)（4 次過(guò)河，3 次返回），確保所有物品安全抵達(dá)對(duì)岸。

而且從 Qwen3 的思考過(guò)程能夠看到，其思維方式和人類(lèi)一樣，是通過(guò)不斷推翻各種方案來(lái)找出可行路徑。

再來(lái)一道超高難度專(zhuān)業(yè)數(shù)學(xué)題。

原題來(lái)自今年的普特南數(shù)學(xué)競(jìng)賽，該競(jìng)賽號(hào)稱(chēng)最難本科數(shù)學(xué)考試，人類(lèi)要考 6 小時(shí)，并且所選取的題目據(jù)稱(chēng)前 500 名選手均未能完整作答。

而扔給 Qwen3 后，可以看到整體的思考時(shí)間確實(shí)明顯變長(zhǎng)，最終用時(shí)5 分 38 秒給出了正確答案。

p.s. 千問(wèn)智能體無(wú)法直接上傳圖片，最終選擇從 App 首頁(yè)上傳圖片，提取文字后繼續(xù)使用千問(wèn)智能體作答。

更有趣的是，扒一扒其思考過(guò)程，還能看到模型在線表演 " 崩潰 "：

當(dāng)然，雖然 AI 的解讀速度和正確率明顯勝于人類(lèi)，但還是要和同類(lèi)來(lái)比。

在國(guó)外網(wǎng)友的測(cè)試中，同一道題 Grok 3（Think）在約 8 分鐘內(nèi)找到了解決方案。

所以對(duì)比下來(lái)，這一局算 Qwen3 略勝一籌。

第三關(guān)：多語(yǔ)言能力

另外據(jù)介紹，Qwen3 的一大亮點(diǎn)是支持 119 種語(yǔ)言和方言，被網(wǎng)友戲稱(chēng) "AI 屆多鄰國(guó) "（doge）。

別的不說(shuō)，直接讓它來(lái)挑戰(zhàn)一把國(guó)內(nèi)專(zhuān)業(yè)譯者的地位試試。

將莎士比亞《哈姆雷特》的經(jīng)典選段丟給它，讓它按照 " 信達(dá)雅 " 翻譯成中文。

它還知道參考優(yōu)秀譯本，并且注意避免直接抄襲造成侵權(quán)。

最終生成的結(jié)果如下（左側(cè)），對(duì)比我們熟知的朱生豪經(jīng)典譯本（右側(cè)），你覺(jué)得 AI 味兒濃度如何？

第四關(guān)：賽博閨蜜、shopping 比價(jià)、寫(xiě)歌一網(wǎng)打盡

除了以上更側(cè)重模型基礎(chǔ)能力的考查，當(dāng) Qwen3 被塞進(jìn) App 后，我們還解鎖了更多玩法。

做旅游規(guī)劃這種就不必多說(shuō)了，關(guān)鍵還能充當(dāng) " 賽博閨蜜 "，幫忙選擇更適合發(fā)朋友圈的游客照。

日常也能用來(lái)購(gòu)物比價(jià)，比如分析出當(dāng)下最值得入手的 3000 元預(yù)算內(nèi)平板。

不僅用表格清晰列出了各品牌的核心參數(shù)，還按照不同需求進(jìn)行了推薦，一整個(gè)造福伸手黨。

此外，最近火上熱搜的 "AI 寫(xiě)歌 "，我們也用 Qwen3 嘗試了一把。

五一版 · 大張偉嗨歌這就新鮮出爐，光看歌詞確實(shí)有內(nèi)味兒了：

Okk，以上為我們的全部實(shí)測(cè)。

小結(jié)一下，通過(guò)在通義 App 使用 Qwen3 專(zhuān)屬智能體，我們能明顯感受到以下幾點(diǎn)：

Qwen3 旗艦?zāi)Ｐ偷纳伤俣确浅？?，體驗(yàn)很絲滑；

模型擅長(zhǎng)推理，能夠解決經(jīng)典邏輯陷阱和復(fù)雜數(shù)學(xué)題；

代碼能力方面，已經(jīng)能夠快速實(shí)現(xiàn)一些簡(jiǎn)單需求；

由于載體是 App，可拓展的玩法很多。

而且，通義 App 自上個(gè)月頁(yè)面改版后，整體設(shè)計(jì)更簡(jiǎn)潔，交互也更加完善了。

更多網(wǎng)友實(shí)測(cè)

與此同時(shí)，隨著 Qwen3 模型的爆火，更多網(wǎng)友也第一時(shí)間進(jìn)行了試玩。

有和 " 空間內(nèi)彈小球 " 類(lèi)似效果的頁(yè)面設(shè)計(jì)：

還有用阿拉伯語(yǔ)、法語(yǔ)和印地語(yǔ)解釋愛(ài)因斯坦相對(duì)論的玩法，該博主聲稱(chēng)：

簡(jiǎn)單到連十歲的小孩都能理解。

當(dāng)然，大家一直尤為鐘愛(ài)的小游戲開(kāi)發(fā)也安排上了：

開(kāi)源界的新王者

Qwen3 引發(fā)熱議背后，可以看到的是，在開(kāi)源影響力上，以 Qwen 為代表的國(guó)產(chǎn)大模型，已經(jīng)有超越 Llama 之勢(shì)。

這一點(diǎn)，從 reddit LocalLLaMA 等開(kāi)發(fā)者聚集的板塊的最新話(huà)題中，亦可見(jiàn)一斑。

不僅是基準(zhǔn)評(píng)測(cè)數(shù)據(jù)的紙面超越，實(shí)測(cè)越多，模型實(shí)力究竟幾何就越能被客觀公允地認(rèn)知。

而如今的開(kāi)源格局之變，并非一蹴而就。前有 DeepSeek，今有 Qwen3，背后體現(xiàn)的是來(lái)自中國(guó)的開(kāi)源力量一以貫之的努力，和一如既往的" 中國(guó)速度 "。

以 Qwen 為例：

2024 年 11 月底，開(kāi)源推理模型 QwQ；

2025 年春節(jié)檔，連發(fā) Qwen2.5 百萬(wàn)上下文版本、視覺(jué)理解模型 Qwen2.5-VL，還有超大規(guī)模 MoE 模型 Qwen-2.5 Max；

2025 年 3 月，QwQ-32B 以 1/10 成本比肩 DeepSeek-R1；

多模態(tài)方面，還有萬(wàn)相 Wan 的持續(xù)開(kāi)源和迭代……

這還只是短短 5 個(gè)月內(nèi)的進(jìn)展。

再加上更加開(kāi)放和商用友好的 Apache 2.0 協(xié)議，開(kāi)發(fā)者們的轉(zhuǎn)向，自然在情理之中。

作為普通用戶(hù)，一方面，可以在通義 App 這樣的官方應(yīng)用上更快感知到滿(mǎn)血模型的能力。

另一方面，也可以期待開(kāi)源，帶來(lái)更多衍生應(yīng)用的可能性。

那么，再次打開(kāi)傳送門(mén)：

tongyi.com

如果你探索到了什么新鮮玩法，也歡迎在評(píng)論區(qū)跟大家分享 ~

參考鏈接：

[ 1 ] https://x.com/YUEXINWANG61157/status/1917059240360919318

[ 2 ] https://x.com/kis/status/1917090589931409750

[ 3 ] https://x.com/godofprompt/status/1917147674438255021

一鍵三連「點(diǎn)贊」「轉(zhuǎn)發(fā)」「小心心」

歡迎在評(píng)論區(qū)留下你的想法！

— 完 —

點(diǎn)亮星標(biāo)

科技前沿進(jìn)展每日見(jiàn)

宙世代

ZAKER旗下Web3.0元宇宙平臺(tái)

一起剪

ZAKER旗下免費(fèi)視頻剪輯工具

相關(guān)標(biāo)簽

ai 閨蜜

相關(guān)閱讀

今年5月至少有17款重磅新機(jī) 華OV線下發(fā)力小米有驚喜？

數(shù)碼測(cè)評(píng) 1小時(shí)前

高通驍龍8s Gen4勁敵！聯(lián)發(fā)科天璣9400e來(lái)了：一加全球首發(fā)

快科技 29分鐘前

騰訊3億押注，2 年收入漲3.6倍，沖鋒衣 “平替之王” 如何煉成？

36氪 1小時(shí)前

小米板王！小米平板7 Ultra現(xiàn)身

快科技 1小時(shí)前

美團(tuán)推“自帶杯立減” 首年預(yù)計(jì)萬(wàn)家飲品店響應(yīng)環(huán)保號(hào)召

快科技 1小時(shí)前

華為推新固態(tài)硬盤(pán)：速度2000MB/s 1TB版本769元

快科技 2小時(shí)前

蘋(píng)果手機(jī)為何無(wú)法在美制造：原因揭開(kāi)

快科技 3小時(shí)前

有人狂賺2.5億，出海短劇殺瘋了

網(wǎng)易娛樂(lè) 21分鐘前

充電黑科技又火了！秒殺快充？

雷科技 1小時(shí)前

小米停止推送限制馬力OTA，華為鴻蒙PC版本月發(fā)布，GTA6延期，微軟Xbox漲價(jià)：這就是今天的其他大新聞！

差評(píng) 11小時(shí)前

美團(tuán)反擊力度??？知情人稱(chēng)：內(nèi)部認(rèn)為京東沒(méi)有抖音威脅大

差評(píng) 11小時(shí)前

中國(guó)電子紙平板市場(chǎng)火爆：2025年上半年銷(xiāo)量將超100萬(wàn)臺(tái)

快科技 14小時(shí)前

性?xún)r(jià)比之王！真我 GT7 Pro力壓iQOO、紅米斬獲3000元檔性?xún)r(jià)比手機(jī)冠軍

快科技 13小時(shí)前

最新評(píng)論

沒(méi)有更多評(píng)論了

量子位

訂閱

覺(jué)得文章不錯(cuò)，微信掃描分享好友

掃碼分享

熱門(mén)推薦

68頁(yè)論文再錘大模型競(jìng)技場(chǎng)！Llama4發(fā)布前私下測(cè)試27個(gè)版本，只取最佳成績(jī) 量子位

Blockchain News