Toggle navigation
博客
首页
推荐
标签
轻览
日历
搜索
排序方式:
按更新时间排序
|
按标题排序
|
按浏览次数排序
LLM4REC
LLM
 
投机采样(Speculative Sampling)
LLM
 
LLM模型参数量计算
LLM
 
Chinchilla law
LLM
 
谷歌DiLoCo: Distributed Low-Communication Training of Language Models
论文
 
LLM
 
TensorRT-LLM
LLM
 
架构
 
EVA-CLIP
多模态
 
LLM
 
KV Cache(键值缓存)
Transformer
 
LLM
 
ReLLa: Retrieval-enhanced Large Language Models for Lifelong Sequential Behavior Comprehension in Recommendation
论文
 
LLM
 
推荐系统
 
QLoRA(Quantized Low-Rank Adapter)
LLM
 
Llama3
LLM
 
Meta
 
腾讯混元大模型
LLM
 
腾讯
 
Thinking Claude prompt工具
LLM
 
Grok-3:xAI团队研发的第三代大语言模型
LLM
 
Grok
 
DeepSeek目前发布的模型版本(持续更新)
LLM
 
deepseek
 
PPO(Proximal Policy Optimization)近端策略优化
LLM
 
LLM | LLM入门
LLM
 
Reinforcement Learning from Human Feedback(RLHF)
LLM
 
BBPE(Byte-Level Byte Pair Encoding)字节级字节对编码
LLM
 
XLNet:一种基于Transformer架构的自回归语言模型
LLM
 
«
1
2
3
4
5
6
»