Search: moe - ai.jp.net

infrastructure #llm 📝 Blog分析: 2026年1月16日 16:01

开源AI社区：在普通硬件上运行大型语言模型

发布:2026年1月16日 11:57

•

1分で読める

•

r/LocalLLaMA

分析

开源AI社区真是太了不起了！开发者们正在取得令人难以置信的成就，比如在旧的、资源受限的硬件上运行大型语言模型。这种创新实现了强大AI的普及，为每个人打开了实验和探索的大门。

关键要点

引用

“我能够在10年前的破烂电脑上相对较快地运行大型模型...这简直是太离谱了，每次我能够运行这些模型的时候都感到震惊。”

永久链接 r/LocalLLaMA

research #llm 📝 Blog分析: 2026年1月15日 08:00

DeepSeek AI 推出 Engram：用于稀疏 LLM 的条件记忆轴

发布:2026年1月15日 07:54

•

1分で読める

•

MarkTechPost

分析

DeepSeek 的 Engram 模块通过引入条件记忆轴，解决了大型语言模型中的关键效率瓶颈。这种方法有望通过允许 LLM 高效查找和重用知识，而不是反复重新计算模式，从而提高性能并降低计算成本。

关键要点

引用

“DeepSeek 的新 Engram 模块的目标正是这个差距，通过添加一个与 MoE 并行工作而不是取代它的条件记忆轴。”

永久链接 MarkTechPost

AI Research #LLMs, LoRA, Mixture of Experts, Context Switching 📝 Blog分析: 2026年1月3日 15:36

Temporal LoRA：LLM 中用于上下文切换的动态适配器路由器

发布:2026年1月3日 15:27

•

1分で読める

•

r/LocalLLaMA

分析

本文介绍了一种有趣的实验方法，旨在改进语言模型中的多任务处理并防止灾难性遗忘。 Temporal LoRA 的核心思想是使用轻量级门控网络（路由器）根据输入上下文动态选择合适的 LoRA 适配器，这很有前景。在 GPT-2 上实现的 100% 准确率，虽然是在一个简单的任务上，但证明了这种方法的潜力。该架构关于使用 LoRA 在更大的本地模型上实现混合专家 (MoE) 的建议是一个有价值的见解。对模块化和可逆性的关注也是一个关键优势。

关键要点

引用

“路由器在区分编码提示（例如，import torch）和文学提示（例如，To be or not to be）方面实现了 100% 的准确率。”

永久链接 r/LocalLLaMA

research #llm 📝 Blog分析: 2026年1月3日 12:30

Granite 4 Small：具有大上下文的有限VRAM系统的可行选择

发布:2026年1月3日 11:11

•

1分で読める

•

r/LocalLLaMA

分析

这篇文章强调了像Granite 4.0 Small这样的混合Transformer-Mamba模型在资源受限的硬件上，利用大型上下文窗口保持性能的潜力。关键的见解是利用CPU处理MoE专家，从而释放VRAM用于KV缓存，实现更大的上下文大小。这种方法可以为拥有较旧或功能较弱GPU的用户普及对大型上下文LLM的访问。

关键要点

引用

“由于是混合transformer+mamba模型，它在上下文填充时保持快速”

永久链接 r/LocalLLaMA

Research #llm 📝 Blog分析: 2026年1月3日 07:00

Prime Intellect 发布递归语言模型 (RLM)：范式转变使 AI 能够管理自身上下文并解决长期任务

发布:2026年1月2日 10:33

•

1分で読める

•

r/singularity

分析

本文报道了 Prime Intellect 发布递归语言模型 (RLM) 的消息，这是一种处理 LLM 中长上下文任务的新方法。核心创新是将输入数据视为动态环境，避免了与传统上下文窗口相关的信息丢失。关键突破包括上下文折叠、极高的效率和长期自主性。INTELLECT-3 的发布，一个开源 MoE 模型，进一步强调了透明度和可访问性。本文强调了 AI 在管理和处理信息方面的重大进步，这可能导致更高效、更强大的 AI 系统。

关键要点

引用

“全球“大脑”的物理和数字架构正式进入新阶段。”

永久链接 r/singularity

Research Paper #Materials Science, Thermoelectrics, 2D Materials 🔬 Research分析: 2026年1月3日 06:20

单层SnTe2的超低热导率

发布:2025年12月31日 16:00

•

1分で読める

•

ArXiv

分析

本文研究了单层碲化锡（SnTe2）的导热性能，这是一种二维金属材料。这项研究意义重大，因为它确定了其超低晶格热导率的微观起源，使其在热电应用中具有前景。该研究使用第一性原理计算来分析材料的稳定性、电子结构和声子色散。研究结果强调了重Te原子、弱Sn-Te键合和平坦声学分支在抑制声子介导的热传输中的作用。本文还探讨了材料的光学性质，表明其在光电应用中的潜力。

关键要点

引用

“论文强调，重Te原子、弱Sn-Te键合和平坦声学分支是导致超低晶格热导率的关键因素。”

开源AI社区：在普通硬件上运行大型语言模型

分析

关键要点

DeepSeek AI 推出 Engram：用于稀疏 LLM 的条件记忆轴

分析

关键要点

Temporal LoRA：LLM 中用于上下文切换的动态适配器路由器

分析

关键要点

Granite 4 Small：具有大上下文的有限VRAM系统的可行选择

分析

关键要点

Prime Intellect 发布递归语言模型 (RLM)：范式转变使 AI 能够管理自身上下文并解决长期任务

分析

关键要点

单层SnTe2的超低热导率

分析

关键要点

开源LLM中的计算量与精度权衡

分析

关键要点

废物转化为能源的 AI 数据中心：冷却效率和电网弹性

分析

关键要点

用于LLM预训练的联合数据选择

分析

关键要点

TeleChat3-MoE 训练报告概述

分析

关键要点

RepetitionCurse: 针对MoE LLM的DoS攻击

分析

关键要点

用于跨视角地理定位的可学习查询聚合

分析

关键要点

基于音频控制的表达性人形机器人运动

分析

关键要点

动态子空间组合：通过收缩基底扩展实现高效适应

分析

关键要点

通过专家-路由器耦合改进混合专家模型

分析

关键要点

MoEDAL-MAPP实验探测带电长寿命BSM粒子的前景：迷你综述

分析

关键要点

YOLO-Master：用于实时目标检测的自适应计算

分析

关键要点

FLEX-MoE：面向资源受限FL的联邦混合专家模型

分析

关键要点

小米MiMo v2 Flash声称以2.5%的成本实现Claude级别的编码，文档混乱

分析

关键要点

用于多模态情感分析的文本路由MoE模型

分析

关键要点

RollArt：通过分解基础设施加速 Agentic RL 训练

分析

关键要点

Scalpel-SAM：用于红外小目标检测的半监督范式

分析

关键要点

Strix Halo Llama-bench 结果 (GLM-4.5-Air)

分析

关键要点

乐天发布7000亿参数日语LLM 'Rakuten AI 3.0'，计划部署于服务

分析

关键要点

石墨烯太赫兹响应协同效应：一种新型能量收集方法

分析

关键要点

FUSCO: 通过变换-通信融合实现MoE模型的高性能数据混洗

分析

关键要点

MiniMax M2.1开源：真实世界开发和代理的最新技术

分析