BR 技术头条 技术链接、资讯与社区分享流
te tech.meituan.com / 2023-02-12 14:37 / by @技术头条

美团视觉GPU推理服务部署架构优化实践

打开原文 喜欢 1 请先微博登录后参与 0 条评论
本机暂存
面对在线推理服务使用的GPU资源不断增加、GPU利用率普遍较低的挑战,美团视觉研发团队决定通过模型结构拆分和微服务化进行优化,他们提出一种通用高效的部署架构,来解决这种常见的性能瓶颈问题。以“图像检测+分类”服务为例,优化后的服务压测性能指标GPU利用率由40%提升至100%,QPS也提升超过3倍。本文将会重点介绍推理服务部署架构优化的工程实践,希望对大家能有所帮助或启发。

发表评论

请先微博登录后参与