通义千问发布会:720亿参数模型Qwen-72B震撼世界,开创高性能应用新纪元
阿里云在12月1日的通义千问发布会上宣布开源通义千问720亿参数模型Qwen-72B。该模型在10个权威基准测评中创下了开源模型最优成绩,超越了国际开源标杆Llama 2-70B和大部分商用闭源模型。Qwen-72B基于3T tokens高质量数据训练,在部分测评中甚至超越了闭源的GPT-3.5和GPT-4。它能够处理最多32k的长文本输入,并在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。这款模型的开源性使得企业级、科研级的高性能应用有了更多选择。