Toggle navigation
博客
首页
推荐
标签
轻览
日历
搜索
Speculative decoding(推测性解码)
NLP
 
Transformer
 
Causal Attention(因果注意力)
Attention
 
TFLOPS(teraFLOPS缩写)
硬件
 
指标
 
Gemma 2: Improving Open Language Models at a Practical Size,Grouped Query Attention(GQA机制)
DeepMind
 
高带宽内存(High Bandwidth Memory,HBM)
硬件
 
论文:FSQ - FINITE SCALAR QUANTIZATION: VQ-VAE MADE SIMPLE
VAE
 
论文
 
大模型思维树(Tree of Thoughts,ToT)
LLM
 
模型自我对弈
概念
 
符号逻辑(Symbolic Logic)
数学
 
Claude:由Anthropic公司开发的大型语言模型
LLM
 
DeepSeek V3开源大语言模型
LLM
 
DeepSeek
 
论文:Apollo: An Exploration of Video Understanding in Large Multimodal Models
论文
 
LLM
 
DeepSeek-VL2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding
LLM
 
DeepSeek
 
如何搭建智能体Agent
LLM
 
AttributeError: 'module' object has no attribute '_internal_create_key'
常见问题
 
tf.range
TensorFlow
 
TensorFlow函数
 
tf.sort
TensorFlow
 
TensorFlow函数
 
华为跨域推荐 Enhancing CTR prediction in Recommendation Domain with Search Query Representation
推荐系统
 
华为
 
推荐系统中的全域用户建模
推荐系统
 
SWIFT(Scalable lightWeight Infrastructure for Fine-Tuning)
LLM
 
tf.feature_column.shared_embedding_columns
TensorFlow
 
TensorFlow函数
 
tf.feature_column.weighted_categorical_column
TensorFlow
 
TensorFlow函数
 
论文:Multi-Faceted Hierarchical Multi-Task Learning for a Large Number of Tasks with Multi-dimensional Relations
论文
 
MTL
 
Meta Learning——MAML
算法
 
DNN
 
快手召回新范式 KuaiFormer: Transformer-Based Retrieval at Kuaishou
召回
 
快手
 
论文:EXIT: An EXplicit Interest Transfer Framework for Cross-Domain Recommendation,全域用户建模
跨域推荐
 
推荐系统
 
美团
 
论文:GateNet: Gating-Enhanced Deep Network for Click-Through Rate Prediction
推荐系统
 
精排
 
稀疏编码(Sparse Coding):数据表示与特征学习的有效方法
深度学习
 
表示学习
 
SIFT(Scale-Invariant Feature Transform):图像特征提取的经典算法
机器视觉
 
TensorFlow函数 tf.add_n
TensorFlow
 
TensorFlow函数
 
论文阅读 TOKEN MERGING: YOUR VIT BUT FASTER(ToMe模型)
Transformer
 
CMMLU(Chinese Multi-task Language Understanding)中文多任务基准数据集
数据集
 
LLM
 
NLP评估指标之ROUGE
NLP
 
指标
 
spark参数
spark
 
图像处理中的Patch token
机器视觉
 
Yann LeCun
计算机科学家
 
论文:Efficient Attention: Attention with Linear Complexities
论文
 
注意力机制
 
EvalMuse-40K数据集
数据集
 
论文:Large AI Model Empowered Multimodal Semantic Communications
LLM
 
论文:A Survey on User Behavior Modeling in Recommender Systems
序列建模
 
综述
 
推荐系统中结合业务建模的一些例子
推荐系统
 
美团外卖CoFARS模型:Context-based Fast Recommendation Strategy for Long User Behavior Sequence in Meituan Waimai
美团
 
论文
 
推荐系统
 
美团DGIN模型:Deep Group Interest Modeling of Full Lifelong User Behaviors for CTR Prediction
序列建模
 
美团
 
百度ERNIE:基于知识增强的预训练语言模型
LLM
 
百度
 
腾讯终身交叉网络LCN模型:Cross-Domain LifeLong Sequential Modeling for Online Click-Through Rate Prediction
论文
 
序列建模
 
腾讯
 
字节多兴趣建模:Trinity: Syncretizing Multi-/Long-tail/Long-term Interests All in One
论文
 
多兴趣建模
 
字节
 
前端FMP(First Meaningful Paint)指标
指标
 
LangChain框架
框架
 
LLM
 
Web Neural Network API(WebNN):一个专为神经网络推理硬件加速而设计的低级API
Web应用
 
Intel Math Kernel Library(简称 MKL):一款高性能数学计算库
工具库
 
«
1
2
…
5
6
7
8
9
10
11
…
48
49
»