200 多行代码,低成本复现 DeepSeek R1「Aha Moment」,复旦大学开源!
发布人:张桂英 点击量:48 次
机器之心2月18日消息,复旦大学知识工场实验室肖仰华教授、梁家卿青年副研究员团队发布最新研究成果,他们基于GRPO算法,用仅 200 多行代码高效复现了 DeepSeek R1-zero 的自发反思能力,并将项目(Simple-GRPO)第一版代码开源至 Github。DeepSeek-R1-zero 经过强化学习实现的「Aha Moment」,使模型具备类似人类的自我反思和策略调整能力,因此引发...
绕开DeepSeek技术思路,马普所团队开源推理模型新路线
发布人:张桂英 点击量:62 次
DeepTech深科技 2 月 12 日消息,当众多 AI 开发者聚焦 DeepSeek 技术路线时,来自德国马普所智能系统研究所、美国马里兰大学和美国劳伦斯利弗莫尔国家实验室的团队,提出一种全新的推理模型路线,该路线绕开思维链,通过采取深度循环隐式推理方式,为大模型性能扩展开辟了新维度。该团队研发出一种新型语言模型架构,通过潜空间中的隐式推理来扩展测试时计算,打造出概念验证模型 Huginn,其...
撞车DeepSeek NSA,月之暗面发布新注意力架构 MoBA,性能与效率双优
发布人:张桂英 点击量:34 次
机器之心2月19日消息,在2月18日DeepSeek 发布新注意力机制 NSA 的当天,月之暗面也推出名为 MoBA(块注意力混合)的注意力机制,旨在提高模型处理长序列任务的效率和性能,相关代码已公开。MoBA 基于混合专家(MoE)原理,将其创新性应用于注意力机制,遵循“更少结构”原则,让模型自主决定关注位置。它通过可训练的块稀疏注意力、无参数门控机制、完全注意力与稀疏注意力的无缝切换,有效降低...
DeepSeek推出原生稀疏注意力机制NSA,重塑长文本建模
发布人:张桂英 点击量:86 次
AI寒武纪2月18日消息,DeepSeek研究团队推出原生稀疏注意力(Native Sparse Attention,NSA)机制,旨在实现高效的长上下文建模。长上下文建模对于下一代语言模型至关重要,但传统注意力机制的计算复杂度随着序列长度的增加而呈平方级增长,成为制约模型发展的关键瓶颈。同时,现有稀疏注意力方法存在推理效率的“假象”,仅在自回归解码时稀疏,预填充阶段仍需大量计算,且与现代高效解码...
DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升
发布人:张桂英 点击量:176 次
量子位 2 月 17 日消息,DeepSeek团队发布了一项最新研究,通过将代码转换成思维链的方式,全面提升了大模型的各种推理能力。研究团队认为,在代码当中暗含了不同类型场景的思考过程,于是想要把这种思考过程“提取”出来训练推理模型。他们利用300多万个实例构建了数据集CODEI/O,并对Qwen、Llama等模型进行了训练。结果显示,模型不仅在代码相关任务上表现出色,还在非代码类推理任务中展现出...
欧盟启动InvestAI计划,拟筹资2000亿欧元用于人工智能
发布人:张桂英 点击量:44 次
据欧盟委员会2月11日消息,欧盟委员会主席冯德莱恩发起InvestAI计划,以筹集2000亿欧元用于人工智能投资。据悉,InvestAI基金将为欧盟各地未来的四座AI超级工厂提供资金,以训练负载、庞大的AI模型。这些超级工厂将拥有约十万个最新一代AI芯片,大约是目前正在建立的AI工厂的四倍。此外,欧盟委员会还将成立欧洲人工智能研究委员会,以便集中资源,探索如何利用尚未开发的数据潜力来支持人工智能和...
法国宣布1,120亿美元AI投资计划,挑战美国“星门计划”
发布人:张桂英 点击量:45 次
2025年2月10日,法国总统马克龙宣布了总额达到1,090亿欧元(约合1,120亿美元)的人工智能(AI)投资计划,旨在加速法国及欧洲的AI发展。此次宣布是在巴黎举办的人工智能行动峰会期间,标志着法国在AI领域的大规模投资。这项资金将分批投入未来几年,主要用于建设AI数据中心,与美国的“星门计划”相呼应。马克龙表示,法国将加速在AI领域的发展,并强调这笔投资与美国5000亿美元的“星门计划”相当...
k1.5 新模型登场:Kimi 如何做到满血版多模态o1水平(附技术报告)
发布人:张桂英 点击量:673 次
1月20日, Kimi发布的全新SOTA模型 ——k1.5 多模态思考模型。这是继去年 11 月发布 k0-math 数学模型、12月发布 k1 视觉思考模型之后,连续第三个月带来 k 系列强化学习模型的重磅升级。一、k1.5多模态思考模型K1.5性能方面,实现了 SOTA级别的多模态推理和通用推理能力。具体来说,在 short - CoT 模式下,k1.5 的数学、代码、视觉多模态和通用能力大幅...
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
发布人:张桂英 点击量:3336 次
1月20日,来自杭州的深度求索(DeepSeek)发布 DeepSeek-R1模型,并同步开源模型权重。DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1上线API,对用户开放思维链输出,通过设置 `model=deepseek-reasoner` 即可调用。DeepSeek 官网与 App 即日起同步更新上线。性能对齐Ope...
阶跃星辰推出推理模型Step Reasoner mini
发布人:张桂英 点击量:383 次
1月16日,阶跃星辰推出自研推理模型 Step Reasoner mini(简称Step R-mini)。Step Reasoner mini 是 Step 系列模型家族的首个推理模型,擅长主动进行规划、尝试和反思,能通过慢思考和反复验证的逻辑机制,为用户提供准确可靠的回复。它既擅长通过超长推理能力,解决逻辑推理、代码和数学等复杂问题,也能兼顾文学创作等通用领域。目前,阶跃星辰自研的 Step 系...
共128页 <<  < 2 3 4 5 6 7 8 9 10 11 >  >>