大伙有没有发现,最近AI圈有个越来越明显的趋势:怎么大家全在卷编程啊?

像Claude就不用说了,编程能力一直是标杆,其他人都得猛猛追;咱国产的GLM、MiniMax,最近发布的新模型也都在往编程上猛冲。就连OpenAI,最近都砍掉了烧钱的Sora视频业务,把算力省出来聚焦生产力工具,说白了也就是编程和企业服务。


年初的时候,Anthropic就专门出了份《2026 Agentic Coding Trends Report》,预测就在今年,开发者会从"写代码的人"变成"指挥AI写代码的人"。

行业里有个专门的叫法,Agentic Coding——让AI不只帮你写代码,而是直接帮你把活干了。你只要说清楚"我想要个什么东西",AI自己去理解、拆解、写代码、测试、改bug,直到交付一个能用的成品。

然后,就在这个全行业卷编程的节骨眼上,阿里发布了他们最新的大模型,Qwen3.6-Plus。不儿,3.5不是春节才出吗,前几天还刚出了个3.5-Omni,这速度是要飙车啊?

而且还不只是这一个模型,过去这一周,除了 3.5 Omni,阿里还发了图片模型Wan-2.7-image,再加上这次的3.6-Plus,主打一个全面开花,据说,旗舰版Qwen3.6-Max也已经在路上了。这更新密度,都能和网文作者打打了。

从阿里公布的数据来看,千问3.6在SWE-bench系列和Claw-Eval等权威评测里,较上一代3.5有显著提升,跑分不仅能登顶国内排行榜,而且是用更小的参数量打赢的,可以说是当下最强、最接近编程领域大神 Claude 的国产模型。


而且,模型更新的时间点也挺有意思的。上个月,千问技术负责人林俊旸离职的消息刚刷了一波屏,好多网友都搁那问,那Qwen以后还更新吗?结果千问说,更,我还要加速更。。

不光更了,这次瞄准的方向,也是当下AI圈最火的编程。这也算是在这个大家都在卷编程的节骨眼上,交出的一份答卷。

所以,说了这么久,Qwen3.6到底咋样啊?世超也直接上阿里云百炼搞了个API来,带大家亲自上手测一下。先省个流:这波升级,还真有点东西。


现在的AI,已经不是说句话就能讨好我们的了,龙虾等各种Agent出现,让AI动手已经成家常便饭了。于是哥们先给我的龙虾换了个脑子,直接接入Qwen3.6-Plus!

千问3.6号称全模态,文字图片视频都能读,那我们就先来个最狠的吧——直接丢视频。

这次的任务是,我自己用手机录一段视频,里面是我在电脑上打开了一个网站,然后我边滚动边给Qwen讲解,这里需要的功能,需要的特效啊,巴拉巴拉说了一堆,说实话我讲得很抽象,连“帅不帅”这样的词都用上了。

提示词也是简简单单。


结果,任务完成度有点出乎我意料了。那么大个(200多M)视频过去,你读完,然后复刻成这个程度,还配合我的抽象指令,我觉得相当可以了,连“进入专业评选”这个需求都做上了。


当然还是有点bug,比如某些元素有点丑啊,评委没有滚动展示啊,交互按钮动不了啊。。指望AI一次出完美的东西还是有点难的。

于是我又把这些反馈给它回复了一轮,给出的结果,完成度就相当高了。


以前,咱最头疼的就是咋把自己的想法,翻译成纯文本告诉AI,是真的难,一是术语太多了,二是精确描述一件事,那和写论文有啥区别,你想想你写论文时候掉的头发你就懂了。

所以现在,当你能直接跟AI视频通话后,普通的vibe coding已经黯然失色了,现在赶到赛场的是,视频vibe coding。

对了,这次的Qwen在“仓库级”复杂任务的表现上也有大加强。

为啥叫仓库呢?因为真实的程序员,写代码面对的不是一个文件,是几百上千个文件,理解一个项目得先搞清楚目录结构,哪个文件调用了哪个,数据从哪来到哪去,理清楚代码之间的关系可能就得几天。所以想真干活,不只是"能不能懂代码",而是能不能读懂整个项目,然后在里面干活。

大伙应该听说了最近Claude Code源码泄露那事儿,不知道的可以去看我们昨天的文章,反正就是,AI大厂把自家产品的底裤泄露了,源码被人搬到GitHub上之后迅速传开,后来还有人直接搞了个开源重制版。

所以世超就直接把GitHub上,这个开源重制版仓库克隆到了本地。


但对很多人来说,这种新闻只能看个热闹,源码这玩意,是你给我我就能读得懂的吗?

那你说这个我就不困了。现在的AI太好用了,咱直接用AI帮我们分析。我直接把仓库在电脑上的位置,和我想要的效果发给了它。

结果Qwen3.6配合龙虾,直接深入我的电脑,找到了这个仓库。


不过我还以为一次读一个仓库,会把它脑袋读晕。在发了一堆我看不懂的代码之后,一个神秘的网站,就被它创造出来了。


结果,这是真有点帅了,完美的渐变蓝,还放了仓库里的logo,往下滑还有渐入的动效,甚至还贴心地做了去往 GitHub 的跳转。


不过这就让它结束了,我是不甘心的,主要还是我看不懂英文,而且网站讲得很泛啊,开局几张图,后面就开始笼统概括,我想知道这项目真正的秘密在哪,能不能帮我挖一下啊。

结果,在我下达指令之后,它还真挖出来了,然后把它做成了中文网站,把源码里藏着的好东西都给我看了,还翻译成了大白话,以后吃瓜就靠这位大哥了。


而且,最重要的是我也没有指路,它自己翻代码、找重点、理解逻辑,然后把需求一层层拆开做了。这一整套下来,已经能看出Qwen3.6在这种仓库级复杂任务上表现很强大了。


对了,经常用大模型的都知道,现在的token是越来越不够用了,以至于很多人都有了token焦虑。

于是我做了一个token计算器,精打细算这一块。。我下载的是DeepSeek V3的tokenizer,就是用来数token的那个东西,然后让AI帮我打包成了个可执行文件。


不过我说实话,有点丑啊,我能不能把它改得好看点,就像一个聊天框那样呢?

于是我把和Claude的聊天框丢给它了,让它照着这个做。对了,因为用AI搞过我的文件夹,所以我文件夹还有点乱,我已经分不清哪个是哪个了。



第一次出来的结果,和我理解有些小偏差,是给原来那个程序,外观换了个皮。于是我又补充说明了一版:


这下听懂了,等了两分钟就给我做出来了,已经跟Claude的聊天框没啥区别了


甚至我都没要求,他还主动装样子,给我加了个模型切换,这是真细节了。(虽然没用,但是有种掌控感)


从视频复刻网页,到读懂复杂的代码仓库,再到一个token计算器说改就改,测到这儿,其实咱的感受已经挺明确了,AI干活的边界,正在被越推越远。

因为Qwen3.6这波进化,你已经能直接给AI丢视频、丢截图、丢一整个代码仓库,让它自己去看、去理解、去动手改。这也印证了前面说的,这种能直接帮我们干活的Agentic Coding,正在成为各家现阶段的首要目标。

而且,整个千问的节奏也在变。以前千问的印象是"开源界顶流",跑分能打,开发者爱用。现在阿里搞了个ATH事业群,吴泳铭亲自带队,把模型研发、平台、C端B端应用全串成一条线,品牌也统一成了"千问",从造Token到送Token到用Token一条龙,形成闭环。

就像Anthropic那份报告里提到,现在开发者日常工作里大概有60%已经在用AI了,但真正能完全甩手让AI独立干的,也就不到20%。也就是AI现在更像副驾驶,还没到完全自动驾驶那一步。

但方向已经很清楚了,连销售、法务、运营都开始自己用AI写小工具解决问题了,这个趋势对来Qwen在内的国产模型来说,其实是个机会。当AI编程从极客的玩具变成大伙的日常工具,价格和生态就是决定谁能铺开的关键。

便宜、迭代快、生态优秀、还越来越能干活,这就是Qwen现在手握的优势。不是每个场景都需要请Claude出山的,一个够用、不贵、还在疯狂进化的国产选择,对大部分人来说已经挺香了。

最后,新模型已经上了百炼对外提供API服务,也已接入悟空、Qoder和Qwen Chat官网,大伙都自己去试试吧。合不合你心意,跑一跑就知道了。

撰文:不咕

编辑:江江

美编:素描

图片、资料来源

Qwen,Anthropic,Github,Deepseek,X