6月7日消息,今天阿里云在其技術(shù)博客上宣布,正式發(fā)布了全球性能強的開源模型Qwen2-72B。
這一新模型在性能上超越了美國強的開源模型Llama3-70B,同時也領(lǐng)先于包括文心4.0、豆包pro、混元pro在內(nèi)的眾多中國閉源大模型。
目前,所有人均可在魔搭社區(qū)和Hugging Face免費下載通義千問新開源模型。
此前開源的Qwen1.5-110B已領(lǐng)先于文心4.0等一眾中國閉源模型
Qwen2系列模型在代碼、數(shù)學、推理、指令遵循、多語言理解等能力上實現(xiàn)了大幅提升。
在MMLU、GPQA、HumanEval等國際權(quán)威測評中,Qwen2-72B一舉斬獲多項世界冠軍,展現(xiàn)了其卓越的性能。
Qwen2-72B在十多個權(quán)威測評中獲得冠軍,超過美國的Llama3-70B模型
此外,Qwen2系列包含5個尺寸的預(yù)訓練和指令微調(diào)模型,均使用了GQA(分組查詢注意力)機制,為用戶帶來了推理加速和顯存占用降低的優(yōu)勢。
阿里云CTO周靖人表示,堅持開源開放是阿里云的重要策略,旨在打造AI時代開放的云,讓算力更普惠、讓AI更普及。
Qwen2的發(fā)布,不僅為全球開發(fā)者提供了強大的工具,也為推動AI技術(shù)的普及和發(fā)展做出了貢獻。
目前Qwen2系列模型的API已登陸阿里云百煉平臺,并獲得了全球眾多開源平臺和工具的第一時間支持。
此外,Qwen系列模型的總下載量在一個月內(nèi)翻了一倍,突破1600萬次,顯示出其在全球開源社區(qū)中的廣泛影響力。
本文鏈接:http://www.guofajx.com/news-130060.html阿里云發(fā)布全球強Qwen2開源模型!超越文心4.0等閉源大模型