您的当前位置:首页 > 休闲 > 阿里巴巴开源1100亿参数版通义千问人工智能模型 模型推理时更加高效 – 蓝点网 正文
时间:2026-03-24 01:43:15 来源:网络整理 编辑:休闲
阿里巴巴旗下通用人工智能研究团队目前已经推出参数高达 1100 亿的通义千问人工智能模型,和此前推出的同样相同,Qwen1.5-110B 版模型依然是开源免费提供的,任何人都可以获取该模型并根据需要进
阿里巴巴旗下通用人工智能研究团队目前已经推出参数高达 1100 亿的阿里通义千问人工智能模型,和此前推出的巴巴同样相同,Qwen1.5-110B 版模型依然是开源开源免费提供的,任何人都可以获取该模型并根据需要进行微调和使用。亿参
通义千问团队称近期开源社区陆续出现千亿参数规模以上的数版时更大型语言模型,这些模型都在各项评测中取得了杰出的通义推理成绩,通义千问现在也推出千亿规模参数的千问开源模型。

Qwen1.5-110B 是人工基于通义千问 1.5 系列训练的模型,在基础能力评估中与 Meta-Llama3-70B 版媲美,模型模型在 Chat 评估中表现出色,加高包括 MT-Bench 和 AlpacaEval 2.0 测试。效蓝
该模型采用 Transformer 解码器架构,点网但包含分组查询注意力 (GAQ),阿里模型在推理时将会更加高效;110B 版模型支持 32K 上下文、巴巴支持英语、开源中文、法语、西班牙语、德语、俄语、日语、韩语、阿拉伯语、越南语等多种语言。
基准测试显示 Qwen1.5-110B 在基础能力方面与 Meta-Llama3-70B 版媲美,由于在这个模型中通义千问团队并没有对预训练方法进行大幅度改变,因此现在基础能力提升应该就是得益于增加模型 (参数) 规模。

另一项测试似乎也证实这个观点,在与 Llama3-70B-Chat 以及 Qwen1.5-72B-Chat 相比,Qwen1.5-110B-Chat 能力都有提升,这表明在没有大幅度改变预训练方法的情况下,规模更大的基础语言模型也可以带来更好的 Chat 模型。

有兴趣的用户可以阅读 Qwen1.5 博客了解该系列模型使用方法,包括 Qwen1.5-110B 的下载和使用等:https://qwenlm.github.io/blog/qwen1.5/
保支新足14天!魔域心袋版新足攻略一篇看懂!2026-03-24 01:36
GamesCom 2013:Xbox One饱吹片放出 拥抱游戏新期间2026-03-24 01:32
资深开辟者:3A游戏处于非常易堪的中间天带2026-03-24 01:24
《怪物猎人Online》能够10月停止2测 《怪物猎人4》成新国仄易远游戏2026-03-24 01:22
《上古卷轴3:晨风》画质优化mod公布 显示效果大提升2026-03-24 01:08
《神雕侠侣》足游开服三天单榜枯登前八2026-03-24 00:59
午间祸利!游仄易远星空独家下浑游戏静态图大年夜放支2026-03-24 00:59
LOL战CF谁才是终究王者?五十大年夜网游终究排止2026-03-24 00:27
值夜班的月亮婆婆的故事2026-03-23 23:08
踩踩后院 《植物大年夜战僵尸:花圃战役》游仄易远星空专区上线2026-03-23 22:57
梅林里的桂花树的故事2026-03-24 01:41
那才是王者之风!真幻3引擎挨制的十款游戏佳做2026-03-24 01:28
舅妈爆料:《逝世神》漫改新游将登岸Switch2026-03-24 01:00
TGS 2013:微硬公布Xbox系游戏出展阵容2026-03-24 00:10
《拂晓:胜利之刻》夏炽花水 松握隆冬2026-03-24 00:02
那是一个超等豪杰的期间 本周安卓游戏TOP102026-03-23 23:52
GamesCom 2013:《小小大年夜星球Hub(LittleBigPlanet Hub)》将登岸PS3 每周齐新闭卡待应战2026-03-23 23:52
您没有是一小我正在战役!游戏中那些给力的小水陪2026-03-23 23:37
初心“游”在,精彩无限!2024 ChinaJoy 全部展商名单 正式公布!2026-03-23 23:18
《沉寂岭》特别节目本周播出:带去游戏 电影新谍报2026-03-23 23:01