分析
微软的Phi-4-reasoning-vision-15B是一款令人印象深刻的全新开源生成式人工智能模型,它可以自主决定何时进行深度思考!凭借其“思考模式”控制,Phi-4在效率和效能之间取得了平衡,展示了更小模型在复杂任务中取得卓越成果的潜力。这种创新方法预示着一个适应性强、高效率的AI新时代的到来。
关于reasoning的新闻、研究和更新。由AI引擎自动整理。
"Phi-4-Reasoning-Vision-15B 在精心策划的推理和非推理数据的混合物上使用监督微调 (SFT) 进行训练。"
"使用LLM程序合成 + 确定性验证,在ARC-AGI2上取得84.0% (840/1000) 的成绩 — 无需微调,无神经搜索"
"现在我发布了 WFGY 3.0,它不再“只是 RAG”。它是一个基于 TXT 的张力推理引擎,旨在对看起来更接近现实世界断裂线的问题进行压力测试。"
"Yao 等人的论文 (NeurIPS 2023) 表明,将 ToT 应用于 GPT-4 后,在 24 点游戏的任务中,成功率从 4% (使用思维链) 提高到 74%。"
"在某些情况下,即使提示中没有明确要求这种结构,响应也似乎采用了基于约束的分解(例如,通过组件交互进行结果建模,在评估指标下进行优化)。"
"视觉语言模型在读取渲染为文本字符(. 和 #)的二元网格时达到约 84% 的 F1 值,但当完全相同的网格渲染为填充正方形时,F1 值下降到 29-39%,尽管两者都是通过相同的视觉编码器获得的图像。"