Toggle navigation
博客
首页
推荐
标签
轻览
日历
搜索
元数据服务(Meta Services)
数据管理
 
Go语言中内置的error接口类型
Go
 
QLoRA(Quantized Low-Rank Adapter)
LLM
 
DeepSeek-Free-API
deepseek
 
api
 
GPU Multi-Process Service(MPS)
GPU
 
工程
 
EJML:用于Java的开源线性代数库
开源库
 
Sparse Adam优化算法
算法
 
Llama3
LLM
 
Meta
 
ConvNeXt:基于卷积神经网络(CNN)的图像识别架构
机器视觉
 
meta
 
thrift - 开源的RPC框架
开源
 
thrift
 
Sublime Merge:一款代码合并和比较工具
工具
 
Spring MVC模块
JavaWeb
 
Figma:一款基于云端的设计工具
工具
 
使用chrome://tracing/查看Tensorflow的timeline文件
Tensorflow
 
论文《Surge Phenomenon in Optimal Learning Rate and Batch Size Scaling》学习率和批量大小
论文
 
推荐系统中的数据流、样本拼接问题
推荐系统
 
样本工程
 
DeepSeek的Native Sparse Attention(NSA)原生稀疏注意力机制
DeepSeek
 
字节TRAE
编程工具
 
P2P(Peer-to-Peer)分发方式
计算机网络
 
LMDB: Lightning Memory-Mapped Database Manager (LMDB)
数据库
 
腾讯混元大模型
LLM
 
腾讯
 
Nvidia H20
GPU
 
Single Instruction Multiple Data(SIMD)
架构
 
DeepSeek MLA(Multi - head Latent Attention)
Deepseek
 
MLA
 
goroutine:Go语言中的一种轻量级的并发执行单元
Go
 
Triton:OpenAI开发的编写高效GPU内核(kernel)的语言和编译器框架,Triton-based kernel
GPU
 
OpenAI
 
bpr loss
DNN
 
Thinking Claude prompt工具
LLM
 
Grok-3:xAI团队研发的第三代大语言模型
LLM
 
Grok
 
千次展现订单数(Orders per Mille, OPM)
指标
 
精排模型优化方向
推荐系统
 
可逆残差网络(RevNets)
深度学习
 
可逆Transformer(Reversible Transformer)
Transformer
 
Reformer: The Efficient Transformer
Transformer
 
RMSprop(Root Mean Square Propagation)
优化器
 
常见的深度学习优化器Optimizer
TensorFlow
 
优化器
 
Dynamic ReLU
激活函数
 
Janus-Pro-7B:DeepSeek推出的一款多模态模型
deepseek
 
DeepSeek目前发布的模型版本(持续更新)
LLM
 
deepseek
 
强化学习入门
reinforcement learning
 
教程
 
强化学习
 
特征工程、特征设计、特征梳理
特征工程
 
强化学习中的策略
强化学习
 
DeepSeek关键技术详解
deepseek
 
MLoRA: Multi-Domain Low-Rank Adaptive Network for Click-Through Rate Prediction
推荐系统
 
精排
 
跨域推荐
 
Large Memory Network for Recommendation,大型记忆网络(LMN)
推荐系统
 
Memory Network
 
Adaptive Domain Scaling for Personalized Sequential Modeling in Recommenders,ADS自适应域缩放
论文
 
推荐系统
 
跨域推荐
 
字节
 
DSSM
NLP
 
flink——流处理框架
架构
 
框架
 
mmh3:一个用于计算 MurmurHash 哈希值的 Python 库
python库
 
Independent Proximal Policy Optimization(iPPO)
强化学习
 
«
1
2
3
4
5
6
7
8
…
47
48
»