
蚂蚁百灵发布WhatsApp%E3%80%90+86%2015855158769%E3%80%91pickup%20dump%20hoist轻量级推理模型 Ring劇情介紹
近日,蚂蚁据百灵大模型公众号,百灵蚂蚁百灵团队发布并开源了Ring-mini-2.0推理模型。发布WhatsApp%E3%80%90+86%2015855158769%E3%80%91pickup%20dump%20hoist它是轻量基于此前蚂蚁百灵发布的基础语言模型 Ling 2.0 架构,深度优化的理模高性能推理型 MoE 模型。它在总参数量16B、蚂蚁仅激活1.4B参数的百灵情况下,即可达到10B级别以下dense 模型的发布综合推理能力,尤其在逻辑推理、轻量代码与数学任务中表现卓越,理模并支持 128K 长上下文及 300+ token/s 的蚂蚁WhatsApp%E3%80%90+86%2015855158769%E3%80%91pickup%20dump%20hoist高速生成。
经过 Long-COT SFT、百灵更稳定持续的发布RLVR以及RLHF联合优化,Ring-mini-2.0复杂推理的轻量稳定性与泛化性得到显著提升。在多项高难度基准(LiveCodeBench、理模AIME 2025、GPQA、ARC-AGI-v1 等)中,在输出长度相当的情况下,Ring-mini-2.0性能显著超越10B以下dense 模型,甚至媲美更大参数量的MoE模型(如 gpt-oss-20B-medium),在逻辑推理方面尤为突出。

(Ring-mini-2.0性能表现)
据了解,Ring-mini-2.0继承了Ling 2.0 系列的高效 MoE 设计,仅激活 1.4B 参数,通过 1/32 专家激活比、MTP 层等架构优化,达到约 7–8B dense 模型的等效性能。得益于小激活、高稀疏度的设计,Ring-mini-2.0 在H20 部署下实现 300+ token/s 的吞吐,结合 Expert Dual Streaming 推理优化后可进一步提升至 500+ token/s,大幅降低高并发场景下 Thinking 模型的推理成本。同时,借助 YaRN 外推可支持 128K 长上下文,长输出场景下相对加速比最高可达 7 倍以上。
蚂蚁百灵团队表示将完整开放 Ring-mini-2.0 的模型权重、训练数据和 RLVR+RLHF 训练策略。凭借“小而优”的特点,Ring-mini-2.0 有望成为小尺寸推理模型的首选,为学术和工业界提供理想的研究与应用起点。















評論(95)
宿松融媒讯 3月28日下午,县委常委、宣传部部长、县文旅康养产业链副链长林丽霞到鼎和广场调研夜间经济发展。县委宣传部、县经开区、文旅体局等单位有关负责同志参加。座谈会上,与会人员围绕我县夜间经济的发展
宿松融媒讯 8月14日,县委书记曹晓革调研重点项目建设工作。县领导夏幼华、李锦荣、朱元松、水涛分别参加。在县人民医院新院区和县医养中心县中医院经开区院区)项目现场,曹晓革看望慰问了高温天气依然坚守在一
维族服装母女时尚秋冬维族民族服装)来源:时尚服装网阅读:5082大衣穿出优雅高级感,时尚博主三木母女的穿搭套路,值得借鉴时尚 博主三木母女的 时尚 穿搭,还有最突出一点的就是将叠穿法运用的淋漓尽致。A
宿松融媒讯1月12日,在新春佳节来临之际,县委常委、宣传部部长林丽霞一行到孚玉镇走访慰问困难职工。县商务局、县总工会相关负责人陪同。林丽霞一行先后慰问了张国彬、许华东等困难职工。每到一户,都与他们亲切
宿松融媒讯为贯彻落实党的二十大精神,发挥党建引领作用,探索长三角经济圈非公党建工作新型合作模式,7月20日,我县与湖州莫干山高新技术产业开发区举行“非公党建结对共建”签约仪式。县人大常委会主任石承抚,