【TechWeb】7月9日消息 , 全球应用交付和API安全解决方案提供商F5宣布F5 BIG-IP Next for Kubernetes推出全新功能 , 该解决方案深度整合NVIDIA BlueField-3 DPU以及NVIDIA DOCA软件框架 , 并已通过欧洲客户Sesterce的实际部署验证 。
作为对F5应用交付与安全平台(F5 Application Delivery and Security Platform)的进一步扩展 , BIG-IP Next for Kubernetes现可原生运行于NVIDIA BlueField-3 DPU , 为大规模AI基础设施提供高性能流量管理与安全防护 , 从而显著提升AI应用的运行效率、控制能力与性能表现 。
借助该联合解决方案 , 企业可将简单的AI相关任务路由至成本更低、更轻量级的LLM以支持生成式AI , 同时将更复杂的查询留给性能更强大的高阶模型处理 。 该可定制化的智能路由机制还支持按领域调用特定 LLM , 从而提升输出质量并显著改善客户体验 。 F5的先进流量管理技术可确保查询精准分发至最适合的模型节点 , 从而降低延迟并加快首个词元生成时间 。
今年早些时候 , NVIDIA推出Dynamo框架 , 旨在为生成式AI与推理模型在大规模分布式环境中的部署提供支撑 。 通过统一调度、流量路由和内存管理等核心任务 , NVIDIA Dynamo有效简化了分布式环境中AI推理的复杂性 , 确保其在动态工作负载下的稳定运行 。 F5与NVIDIA的联合解决方案的核心优势之一 , 是将部分计算操作从CPU卸载至BlueField DPU , 从而显著提升整体效率 。 借助F5技术 , Dynamo KV Cache Manager可基于容量智能路由请求 , 并通过键值(KV)缓存机制 , 显著加速生成式AI应用的响应速度 。 该机制通过复用历史运算信息 , 避免重复计算 , 显著降低资源开销 。 就基础架构而言 , 企业通过KV缓存存储与复用机制 , 相比直接占用GPU昂贵的内存资源 , 能以更低成本实现性能优化 。
【F5携手英伟达全面增强AI时代的性能、多租户与安全能力】另外 , 通过在MCP服务器前端部署F5与NVIDIA联合解决方案 , F5可充当反向代理 , 从而增强MCP解决方案及其所支持LLM的安全能力 。 同时 , F5 iRules提供的全数据可编程能力 , 能够快速并灵活地响应AI协议的快速演进需求 , 并进一步抵御新兴网络安全风险 。
推荐阅读
- BW2025玩创星球即将启幕,七彩虹携手 NVIDIA破界AI次元
- CS专业爆冷,失业率达艺术史2倍,年入千万只需5年,大学却在禁Cursor
- 英伟达铁王坐不稳?ASIC成“心腹大患”,三大软肋暴露无遗
- 7月10日官宣!英特尔携手小旺AI截图,深度适配英特尔AIPC
- 消息称马斯克旗下SpaceX正筹划新一轮融资 估值预计将达4000亿美元
- 英伟达GB10超级芯片获多家PC品牌采用,即将大量出货
- 华为Pura80系列电池最高达5700mAh,一文了解华为P系列手机电池
- 英伟达B200芯片,供不应求
- PICO与Red Stone USA Inc达成北美分销合作
- 减配不降价!英伟达RTX 5090新款中国特供版即将上市
