为啥大厂全在死磕AI编程？试完千问新模型后我悟了。。

大伙有没有发现，最近AI圈有个越来越明显的趋势：怎么大家全在卷编程啊？

像Claude就不用说了，编程能力一直是标杆，其他人都得猛猛追；咱国产的GLM、MiniMax，最近发布的新模型也都在往编程上猛冲。就连OpenAI，最近都砍掉了烧钱的Sora视频业务，把算力省出来聚焦生产力工具，说白了也就是编程和企业服务。

年初的时候，Anthropic就专门出了份《2026 Agentic Coding Trends Report》，预测就在今年，开发者会从"写代码的人"变成"指挥AI写代码的人"。

行业里有个专门的叫法，Agentic Coding——让AI不只帮你写代码，而是直接帮你把活干了。你只要说清楚"我想要个什么东西"，AI自己去理解、拆解、写代码、测试、改bug，直到交付一个能用的成品。

然后，就在这个全行业卷编程的节骨眼上，阿里发布了他们最新的大模型，Qwen3.6-Plus。不儿，3.5不是春节才出吗，前几天还刚出了个3.5-Omni，这速度是要飙车啊？

而且还不只是这一个模型，过去这一周，除了 3.5 Omni，阿里还发了图片模型Wan-2.7-image，再加上这次的3.6-Plus，主打一个全面开花，据说，旗舰版Qwen3.6-Max也已经在路上了。这更新密度，都能和网文作者打打了。

从阿里公布的数据来看，千问3.6在SWE-bench系列和Claw-Eval等权威评测里，较上一代3.5有显著提升，跑分不仅能登顶国内排行榜，而且是用更小的参数量打赢的，可以说是当下最强、最接近编程领域大神 Claude 的国产模型。

而且，模型更新的时间点也挺有意思的。上个月，千问技术负责人林俊旸离职的消息刚刷了一波屏，好多网友都搁那问，那Qwen以后还更新吗？结果千问说，更，我还要加速更。。

不光更了，这次瞄准的方向，也是当下AI圈最火的编程。这也算是在这个大家都在卷编程的节骨眼上，交出的一份答卷。

所以，说了这么久，Qwen3.6到底咋样啊？世超也直接上阿里云百炼搞了个API来，带大家亲自上手测一下。先省个流：这波升级，还真有点东西。

现在的AI，已经不是说句话就能讨好我们的了，龙虾等各种Agent出现，让AI动手已经成家常便饭了。于是哥们先给我的龙虾换了个脑子，直接接入Qwen3.6-Plus！

千问3.6号称全模态，文字图片视频都能读，那我们就先来个最狠的吧——直接丢视频。

这次的任务是，我自己用手机录一段视频，里面是我在电脑上打开了一个网站，然后我边滚动边给Qwen讲解，这里需要的功能，需要的特效啊，巴拉巴拉说了一堆，说实话我讲得很抽象，连“帅不帅”这样的词都用上了。

提示词也是简简单单。

结果，任务完成度有点出乎我意料了。那么大个（200多M）视频过去，你读完，然后复刻成这个程度，还配合我的抽象指令，我觉得相当可以了，连“进入专业评选”这个需求都做上了。

当然还是有点bug，比如某些元素有点丑啊，评委没有滚动展示啊，交互按钮动不了啊。。指望AI一次出完美的东西还是有点难的。

于是我又把这些反馈给它回复了一轮，给出的结果，完成度就相当高了。

以前，咱最头疼的就是咋把自己的想法，翻译成纯文本告诉AI，是真的难，一是术语太多了，二是精确描述一件事，那和写论文有啥区别，你想想你写论文时候掉的头发你就懂了。

所以现在，当你能直接跟AI视频通话后，普通的vibe coding已经黯然失色了，现在赶到赛场的是，视频vibe coding。

对了，这次的Qwen在“仓库级”复杂任务的表现上也有大加强。

为啥叫仓库呢？因为真实的程序员，写代码面对的不是一个文件，是几百上千个文件，理解一个项目得先搞清楚目录结构，哪个文件调用了哪个，数据从哪来到哪去，理清楚代码之间的关系可能就得几天。所以想真干活，不只是"能不能懂代码"，而是能不能读懂整个项目，然后在里面干活。

大伙应该听说了最近Claude Code源码泄露那事儿，不知道的可以去看我们昨天的文章，反正就是，AI大厂把自家产品的底裤泄露了，源码被人搬到GitHub上之后迅速传开，后来还有人直接搞了个开源重制版。

所以世超就直接把GitHub上，这个开源重制版仓库克隆到了本地。

但对很多人来说，这种新闻只能看个热闹，源码这玩意，是你给我我就能读得懂的吗？

那你说这个我就不困了。现在的AI太好用了，咱直接用AI帮我们分析。我直接把仓库在电脑上的位置，和我想要的效果发给了它。

结果Qwen3.6配合龙虾，直接深入我的电脑，找到了这个仓库。

不过我还以为一次读一个仓库，会把它脑袋读晕。在发了一堆我看不懂的代码之后，一个神秘的网站，就被它创造出来了。

结果，这是真有点帅了，完美的渐变蓝，还放了仓库里的logo，往下滑还有渐入的动效，甚至还贴心地做了去往 GitHub 的跳转。

不过这就让它结束了，我是不甘心的，主要还是我看不懂英文，而且网站讲得很泛啊，开局几张图，后面就开始笼统概括，我想知道这项目真正的秘密在哪，能不能帮我挖一下啊。

结果，在我下达指令之后，它还真挖出来了，然后把它做成了中文网站，把源码里藏着的好东西都给我看了，还翻译成了大白话，以后吃瓜就靠这位大哥了。

而且，最重要的是我也没有指路，它自己翻代码、找重点、理解逻辑，然后把需求一层层拆开做了。这一整套下来，已经能看出Qwen3.6在这种仓库级复杂任务上表现很强大了。

对了，经常用大模型的都知道，现在的token是越来越不够用了，以至于很多人都有了token焦虑。

于是我做了一个token计算器，精打细算这一块。。我下载的是DeepSeek V3的tokenizer，就是用来数token的那个东西，然后让AI帮我打包成了个可执行文件。

不过我说实话，有点丑啊，我能不能把它改得好看点，就像一个聊天框那样呢？

于是我把和Claude的聊天框丢给它了，让它照着这个做。对了，因为用AI搞过我的文件夹，所以我文件夹还有点乱，我已经分不清哪个是哪个了。

第一次出来的结果，和我理解有些小偏差，是给原来那个程序，外观换了个皮。于是我又补充说明了一版：

这下听懂了，等了两分钟就给我做出来了，已经跟Claude的聊天框没啥区别了

甚至我都没要求，他还主动装样子，给我加了个模型切换，这是真细节了。（虽然没用，但是有种掌控感）

从视频复刻网页，到读懂复杂的代码仓库，再到一个token计算器说改就改，测到这儿，其实咱的感受已经挺明确了，AI干活的边界，正在被越推越远。

因为Qwen3.6这波进化，你已经能直接给AI丢视频、丢截图、丢一整个代码仓库，让它自己去看、去理解、去动手改。这也印证了前面说的，这种能直接帮我们干活的Agentic Coding，正在成为各家现阶段的首要目标。

而且，整个千问的节奏也在变。以前千问的印象是"开源界顶流"，跑分能打，开发者爱用。现在阿里搞了个ATH事业群，吴泳铭亲自带队，把模型研发、平台、C端B端应用全串成一条线，品牌也统一成了"千问"，从造Token到送Token到用Token一条龙，形成闭环。

就像Anthropic那份报告里提到，现在开发者日常工作里大概有60%已经在用AI了，但真正能完全甩手让AI独立干的，也就不到20%。也就是AI现在更像副驾驶，还没到完全自动驾驶那一步。

但方向已经很清楚了，连销售、法务、运营都开始自己用AI写小工具解决问题了，这个趋势对来Qwen在内的国产模型来说，其实是个机会。当AI编程从极客的玩具变成大伙的日常工具，价格和生态就是决定谁能铺开的关键。

便宜、迭代快、生态优秀、还越来越能干活，这就是Qwen现在手握的优势。不是每个场景都需要请Claude出山的，一个够用、不贵、还在疯狂进化的国产选择，对大部分人来说已经挺香了。

最后，新模型已经上了百炼对外提供API服务，也已接入悟空、Qoder和Qwen Chat官网，大伙都自己去试试吧。合不合你心意，跑一跑就知道了。

撰文：不咕

编辑：江江

美编：素描

图片、资料来源：

Qwen，Anthropic，Github，Deepseek，X