博客
  • 首页
  • 推荐
  • 标签
  • 轻览
  • 日历

深度学习技术汇总

标签: 深度学习   更新于: 2025/04/08 阅读:133 原文发表于:2025-03-21
  • 模型结构
    • Causal Attention
    • GQA
    • SparseMOE
    • LoRA
    • Perceiver
    • ZeRO
  • 工程架构
    • Triton
    • BF16
  • 效率优化
    • FlashAttention
    • Speculative decoding
    • MPS

模型结构

Causal Attention

Causal Attention(因果注意力)

GQA

Grouped Query Attention(GQA机制)

SparseMOE

SparseMOE

LoRA

LLM | LoRA(Low-Rank Adaptation of large language models)

Perceiver

论文:Perceiver - General Perception with Iterative Attention

ZeRO

Zero Redundancy Optimizer(ZeRO)内存优化技术

工程架构

Triton

Triton:OpenAI开发的编写高效GPU内核(kernel)的语言和编译器框架,Triton-based kernel

BF16

BF16和FP16

效率优化

FlashAttention

论文 | FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness

Speculative decoding

Speculative decoding(推测性解码)

MPS

GPU Multi-Process Service(MPS)

深度学习相关文章

  • 深度学习技术汇总
  • BF16和FP16
  • 单精度(Single - Precision)、双精度(Double - Precision)、半精度(Half - Precision)、混精度(Mixed - Precision)
  • 滑动窗口注意力(Sliding Window Attention)
  • Pre Normalization(预归一化)
  • 论文:KAN: Kolmogorov–Arnold Networks
  • 深度学习 | codebook
  • 可逆残差网络(RevNets)
  • R-Drop:一种用于深度学习模型训练的正则化方法
  • 稀疏编码(Sparse Coding):数据表示与特征学习的有效方法

最近热门

  • TensorFlow 实战之调优经验
  • spark两种optimization方法:SGD和LBFGS
  • RetroMAE:一种基于掩码自编码器(Masked Auto-Encoder,MAE)的检索导向预训练框架
  • [TODO] 逻辑回归
  • SSB - Sample Selection Bias - 样本选择偏差问题
  • 实战 - 物品推荐
  • 1.3.1 基础语法
  • 1.1 scala基础教程
  • python库:Google的ABSL(Abseil)库
  • Code Lint(代码检查):一种通过静态分析工具检测代码缺陷的技术

最常浏览

  • 016 推荐系统 | 排序学习(LTR - Learning To Rank)
  • 偏微分符号
  • i.i.d(又称IID)
  • 利普希茨连续条件(Lipschitz continuity)
  • (error) MOVED 原因和解决方案
  • TextCNN详解
  • 找不到com.google.protobuf.GeneratedMessageV3的类文件
  • Deployment failed: repository element was not specified in the POM inside distributionManagement
  • cannot access com.google.protobuf.GeneratedMessageV3 解决方案
  • CLUSTERDOWN Hash slot not served 问题原因和解决办法
×

如侵犯您的权益,请联系本站删除!

Copyright © 2023-2024