Toggle navigation
博客
首页
推荐
标签
轻览
日历
搜索
H3库:Uber开源的地理空间索引系统
uber
 
GIS
 
python库
 
H3地理空间索引系统
GIS
 
GPU型号 H800和A800
GPU
 
英伟达H20与L20的参数对比
GPU
 
OmniGraffle技巧
工具
 
计算模型大小,单位M
代码
 
NCCL(NVIDIA Collective Communications Library) AllReduce
nccl
 
开发
 
NVIDIA
 
NVIDIA的GPU命名规则
NVIDIA
 
GPU
 
NVIDIA Ada Lovelace架构
NVIDIA
 
GPU
 
Soft MoE《FROM SPARSE TO SOFT MIXTURES OF EXPERTS》
论文
 
投机采样(Speculative Sampling)
LLM
 
Fisher信息矩阵(Fisher Information Matrix, FIM)
算法
 
LLM模型参数量计算
LLM
 
TiDB中的RU(Request Unit)
数据库
 
Pre Normalization(预归一化)
深度学习
 
SwiGLU(Swish - gated linear unit)激活函数
激活函数
 
Meta的M-Falcon推理算法
meta
 
算法
 
ByteTransformer: A High-Performance Transformer Boosted for Variable-Length Inputs
字节
 
Transformer
 
Fast Inference from Transformers via Speculative Decoding
论文
 
Chinchilla law
LLM
 
XLA:加速线性代数
架构
 
Model FLOPs Utilization(MFU,模型每秒浮点运算次数利用率)
GPU
 
谷歌MLP - Mixer: An all - MLP Architecture for Vision
论文
 
谷歌
 
谷歌DiLoCo: Distributed Low-Communication Training of Language Models
论文
 
LLM
 
LHUC(Learning Hidden Unit Contributions)
机器学习
 
TensorRT
SDK
 
NVIDIA
 
TensorRT-LLM
LLM
 
架构
 
论文:KAN: Kolmogorov–Arnold Networks
深度学习
 
RQ-VAE(Residual-Quantized VAE)变分自编码器和残差量化
自回归
 
模型量化
 
EVA-CLIP
多模态
 
LLM
 
推荐系统 | 生成式推荐
推荐系统
 
推荐系统中的重排算法
推荐系统
 
重排
 
混排阶段listwise建模方案
混排
 
重排
 
如合提高代码阅读效率及常用prompt
效率
 
keras Sequential
keras
 
dnn
 
论文:Sequential Evaluation and Generation Framework for Combinatorial Recommender System
GE框架
 
重排
 
百度
 
快手OneRec: Unifying Retrieve and Rank with Generative Recommender and Preference Alignment
推荐系统
 
快手
 
java中BIO(Blocking I/O)、NIO(Non-Blocking I/O)和AIO(Asynchronous I/O)的区别
编程语言
 
java
 
深度学习 | codebook
深度学习
 
在div的右上角显示一个复制按钮
网页设计
 
javascript字符串操作
javascript
 
Linux 查看系统类型
linux
 
在 CentOS 上安装 Python 3.12
python
 
Facebook的pacing算法
计算广告
 
tf.assign函数
TensorFlow
 
TensorFlow函数
 
著名的人工智能研究科学家John Schulman
人物
 
科学家
 
Mann-Kendall趋势检验法
时间序列分析
 
Kendall秩相关系数,肯德尔秩相关系数
统计学
 
移动端开发中不同平台框架实现下拉刷新的方法onPullDownRefresh
开发
 
微信小程序开发
 
Geohash地理位置编码
业务
 
«
1
2
3
4
5
6
…
47
48
»