Cloudflare与苏黎世联邦理工学院提出基于AI的CDN缓存优化创新方案
InfoQ中国•2026年4月11日 11:00•infrastructure▸▾
分析
这是网络基础设施领域一项令人兴奋的突破,Cloudflare与苏黎世联邦理工学院出色地解决了由海量智能体流量带来的运营挑战。他们重新思考内容分发网络(CDN)的创新方法,确保了人类用户与AI服务能够在不牺牲性能的前提下高效共存。通过提出动态的、基于机器学习的缓存分层策略,他们为构建具有高度可扩展性的无缝未来互联网铺平了道路。
关于latency的新闻、研究和更新。由AI引擎自动整理。
"默认值为60秒。gpt-image-1 的图像生成最多需要60秒。换句话说,在勉强来不及的情况下,Puma会先强制终止工作进程。这就是导致502错误的原因。"
"直播流上的实际实时推理。模型根本不产生剪辑,而是根据输入持续生成帧。这是一个完全不同的架构,也是一个更难解决的问题。"
"当系统能够实时看到现实世界的变化时,它们将不再依赖于延迟或经过人为筛选的输入。这将极大改变人工智能理解和模拟现实的速度。"
"GPT-Realtime在Pass@1(0.600)和避免中断(13.5%)方面领先;Gemini Live 3.1实现了最快的延迟(4.25秒),但轮流说话率最低(78.0%)。"
"Deepgram的STT和TTS模型系列现在可以在Together AI上原生运行……因此团队可以将Deepgram的转录和合成与Together目录中的任何LLM配对,并在一个生产平台上运行完整的语音管道。"