阿里旗下的Qwen3近期成功登上热搜榜,引发了广泛关注,经过一段长时间的沉淀与积累,Qwen3终于获得了大众的瞩目,此前,其一直默默进行“汪峰之旅”,如今终于获得了应有的关注和认可,这一事件标志着Qwen3在业界的影响力逐渐扩大,也预示着阿里在该领域的持续深耕和积极投入。
经过长时间的努力和积累,阿里旗下的Qwen3终于成功引发了广泛关注,成为了备受瞩目的焦点,此前以“汪峰”身份出现的Qwen3,如今终于迎来了自己的高光时刻,展现了其在社交媒体上的巨大影响力和吸引力,这一重要成就标志着Qwen3在广大用户中的知名度和认可度不断提升,也预示着其未来的发展前景将更加广阔。 Qwen3此次的突破可谓千呼万唤始出来,时隔仅仅七个月,这个AI界的“汪峰”再次凭借全新开源全家桶震撼登场,这个全家桶包含了六款稠密模型和两款MoE模型,支持多达119种语言和方言,相较于前作的最高参数量72B,Qwen3这次推出的旗舰模型Qwen3-235B-A22B堪称超级加倍,总参数量飙升到了庞大的235B。 官方公布的测试结果显示,Qwen3在多个测试集上的表现丝毫不逊色于国内外主流大模型,尤其在代码和数学方面更是略胜一筹,我们亲自上手体验了一番旗舰模型Qwen3-235B-A22B,使用体验非常出色,而且在深度思考功能的设计上也有其独特之处。 之前的大模型常常因为思考时间过长而让用户等待过久,给出的答案过于详细或者质量不高,而Qwen3通过指挥棒交给用户思考的长度和深度,大大提高了模型的灵活性,用户可以根据需要让它思考到任何想要的深度,简单问题让它简单想,复杂问题则让它多琢磨。 举个例子,为了测试它的代码能力,我们让Qwen3编写一个网页上的俄罗斯方块游戏,除了基本的提示词外,我们让模型自行解决游戏玩法、交互、美术等细节,当思考长度设置为1024 token时,Qwen3就像一个刚开始学编码的清澈大学生;而当预算拉满后,它则化身为熟练的老码农,仅几分钟就能编写出一个完全体的俄罗斯方块游戏。 除了代码能力,Qwen3在多模态表现上也让人眼前一亮,除了能应对代码和逻辑难题,它还能轻松应对图像推理等任务,有的网友甚至调侃道:“开盒神器”,Qwen3还追上了MCP的热潮,目前虽然还在测试阶段未开放全部功能,但官方已经展示了两个案例:浏览查询网页上的信息并总结每个项目的star数并画出柱状图;自动分类归纳凌乱的桌面文件也是小菜一碟,这些功能让人期待不已。 Qwen3到底跟之前的大模型有什么不同呢?之前的大模型都是分开的推理和快速回答模型,而Qwen3则是一个“混合推理模型”,相当于R1+V3、o3+4o的结合体,这种混合模型是通过后训练阶段实现的,把长思维链的数据和普通的常用指令放在一起对模型进行微调,确保推理和快速响应能力的无缝结合,目前这种混合大模型在国内只有千问一家且已经慷慨开源! 这一次的Qwen3更新给大模型的开源圈带来了更多惊喜和期待,千问团队提供的不同规模的蒸馏模型任君挑选,从最小的0.6B版本到最大的旗舰模型都展示了强大的性能,随着千问的不断发展,其在开源圈的地位也逐渐稳固,成为全球AI领域的焦点之一,我们期待DeepSeek能够再加速推出更多令人惊艳的产品!