Toggle navigation
博客
首页
推荐
标签
轻览
日历
搜索
混部技术
⛶ 全屏阅读
标签:
架构
  更新于:
2019
/
10
/
18
阅读:1533
什么是混部
把集群混合起来,将不同类型的任务调度到相同的物理资源上,通过调度,资源隔离等控制手段 , 在保障 SLO 的基础上,充分使用资源能力,极大降低成本,我们称这样的技术为
混部
(Co-loaction)。
架构相关文章
NCCL(NVIDIA Collective Communications Library):NVIDIA 开发的一个高性能通信库
进程间空分复用
PCIE(Peripheral Component Interconnect Express):一种高速串行计算机扩展总线标准
访存,访问存储器(Memory Access)
XLA:加速线性代数
TensorRT-LLM
Single Instruction Multiple Data(SIMD)
flink——流处理框架
微服务架构的优缺点
消息队列\Message Queue\MQ
最近热门
论文 | DHEN: A Deep and Hierarchical Ensemble Network for Large-Scale Click-Through Rate Prediction
Chinchilla law
近线召回
MMDetection:一个基于PyTorch的开源目标检测工具箱
Deep Retrieval(DR召回)
快手召回新范式 KuaiFormer: Transformer-Based Retrieval at Kuaishou
java HashMap 按value排序
2.1 机器学习常见算法分类梳理
NVIDIA L20和NVIDIA A30
英伟达H20与L20的参数对比
最常浏览
016 推荐系统 | 排序学习(LTR - Learning To Rank)
偏微分符号
i.i.d(又称IID)
利普希茨连续条件(Lipschitz continuity)
(error) MOVED 原因和解决方案
TextCNN详解
找不到com.google.protobuf.GeneratedMessageV3的类文件
Deployment failed: repository element was not specified in the POM inside distributionManagement
cannot access com.google.protobuf.GeneratedMessageV3 解决方案
CLUSTERDOWN Hash slot not served 问题原因和解决办法
×