dragon

deepseek R1 的部署性能

2025-02-17 vllm ， sglang ，推理

sglang ep 的实现

2024-12-21 sglang ，推理

sglang dp的实现

2024-12-06 sglang ，推理

sglang 的 MLA 代码跟踪

2024-09-01 sglang ，推理

deepseek V2 MLA 的理解

2024-08-10 推理

sglang 的模型执行

2024-07-29 sglang ，推理

vllm prefill 和 decode 的kernel代码解读

2024-04-10 vllm ，推理

megetron server精度问题排查记录

2023-10-22 megatron ，训练，训练框架

LLM 的参数量与计算量

2023-08-13 训练，训练框架

fp16训练的问题

2022-07-16 训练，训练框架

Bert 结构

2022-03-15

Transformer结构

2022-01-27

快手bagua使用教程翻译与摘抄

2021-09-01 训练框架，深度学习

快手的八卦：BAGUA: Scaling up Distributed Learning with System Relaxations论文翻译与赏析

2021-08-31 论文阅读，深度学习

华为的《ScaleFreeCTR:a MixCache-based distributed training system for CTR》

2021-06-15 论文阅读，深度学习

下一页