超过gpt4.1!阿里巴巴QWEN3编程的最强模型
7月23日上午,新的Tongyi Qianwen AI(人工智能)阿里巴巴开源QWEN3-CODER,编程能力达到了全球开源模型训练营,并超过了GPT4.1等封闭的资源模型,并与世界上最强大的计划模型相比。 Qianwen3编程模型创造了具有代码和代理功能(代理)调用功能的重大突破。在刚进入该行业的程序员的Qwen3-Coder的帮助下,有一天可以完成高级程序员的工作,并且在最快的最快生成官方品牌网站只需5分钟即可。 QWEN3-CODER是采用MoE体系结构的Qianwen系列模型中的第一个代码模型。总参数为480B,激活35B参数,本机支持256Ktoken的上下文,可以扩展到1m长度。 QWEN3-CODER在7.5T数据上预先训练70%的代码,并对编程任务和代理任务进行了强化学习S处于训练后阶段,并最终实现了一般能力,代码能力和代理能力的提升:在评估代理能力的评估与浏览器(Webarena)一样,工具调用(BFCL),Qwen3-Coder刷新了开源模型记录,比GPT4.1多;在对独立计划和解决编程活动的SWE基础审查中,Qwen3-Coder实现了与Claude4相当的最佳开放资源影响。
上一篇:江苏使用球作为媒介,在“体积维护”中流量
下一篇:没有了
下一篇:没有了