小红书开源首个大模型dots.llm1，142B参数有何惊人之处？

6月9日传来消息，近期小红书推出了首个大型语言模型，命名为dots.llm1。

dots.llm1是一款规模适中的MoE（大规模语言模型）文本型大模型，该模型由小红书旗下的hi lab（人文智能实验室）团队所开发，其整体参数总量达到1420亿，其中激活参数为140亿。

在具体应用中，当14B参数被激活时，dots.llm.inst模型在处理中英文通用场景、数学问题、代码编写以及对齐任务等方面展现出了出色的能力，其表现相较于Qwen2.5-32B-和Qwen2.5-72B-模型更具竞争优势。与此同时，该模型在中英文、数学和对齐任务上的表现与Qwen3-32B模型相仿。

图源：小红书

此外，dots.llm1的一大亮点在于它采用了高达11.2万亿个token的高质量非合成训练数据，这一规模在当前的开源大型语言模型中实属罕见。

自今年起，小红书在人工智能及大型模型领域频繁发力。开年之际，小红书将内部负责大模型技术及产品研发的团队更名为hi lab，同时开启了“人文训练师”的招募计划，广邀具备丰富人文知识背景的研究人员加入AI训练工作，旨在将人类的智慧与价值观更全面地融入AI系统，以期使AI成为人类有益的助手。

5月27日，小红书hi lab携手复旦大学哲学学院共建“AI人文人才训练营”，致力于开展AI技术后阶段的人文课题合作研究，旨在培育具备“AI+人文”双重能力的复合型专业人才。在AI模型训练过程中，一般包括预训练和后训练两个主要阶段。人文素养的培养构成了后续训练环节的核心内容，对于提升AI在人性化交流、价值观念匹配等方面的能力至关重要。

图源：小红书

原文链接：https://gzkff.club/%e5%b0%8f%e7%ba%a2%e4%b9%a6%e5%bc%80%e6%ba%90%e9%a6%96%e4%b8%aa%e5%a4%a7%e6%a8%a1%e5%9e%8bdots-llm1%ef%bc%8c142b%e5%8f%82%e6%95%b0%e6%9c%89%e4%bd%95%e6%83%8a%e4%ba%ba%e4%b9%8b%e5%a4%84%ef%bc%9f/，转载请注明出处~~~

小红书开源首个大模型dots.llm1，142B参数有何惊人之处？

评论0

在线客服

升级VIP

夜间模式

返回顶部

小红书开源首个大模型dots.llm1，142B参数有何惊人之处？

猜你喜欢

评论0

在线客服

升级VIP

夜间模式

返回顶部