Cactus:智能手机上的Ollama
分析
Cactus是一个跨平台框架,用于在智能手机上本地部署LLM、VLM和其他AI模型。它旨在提供一个注重隐私、低延迟的替代云端AI服务方案,支持各种模型和量化级别。该项目利用Flutter、React-Native和Kotlin Multi-platform实现广泛的兼容性,并包括工具调用和回退到云模型等功能以增强功能。开源性质鼓励社区贡献和改进。
要点
引用 / 来源
查看原文"Cactus enables deploying on phones. Deploying directly on phones facilitates building AI apps and agents capable of phone use without breaking privacy, supports real-time inference with no latency..."