Toggle navigation
博客
首页
推荐
标签
轻览
日历
搜索
PPO(Proximal Policy Optimization)近端策略优化
LLM
 
DeepSeek MOE技术详解
deepseek
 
DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models
论文
 
deepseek
 
TPM基于树的渐进回归模型(Tree based Progressive Regression Model for Watch-Time Prediction in Short-video Recommendation)
论文
 
回归问题
 
PixVerse:一款功能强大的AI视频生成产品
AI应用
 
数据保留(Data Retention)
概念
 
Domain Specific Language(DSL)领域特定语言
术语
 
微服务架构的优缺点
架构
 
Function as a Service(函数即服务)
云计算
 
C++中using关键字的几种不同用途
CPP
 
Gremlin图语言
数据库
 
Gremlin
 
图灵完备性
算法
 
消息队列\Message Queue\MQ
架构
 
框架
 
Hive中的UDF、UDTF、UDAF
hive
 
LLM | LLM入门
LLM
 
KL散度
机器学习
 
Reinforcement Learning from Human Feedback(RLHF)
LLM
 
Replit:一款功能强大的在线开发平台
LLM应用
 
Please commit your changes or stash them before you merge问题的解决方案
git
 
常见问题
 
git rebase 命令
git
 
截断正态分布
概率论
 
LLM OS
LLM应用
 
Joint Embedding 联合嵌入
机器学习
 
BBPE(Byte-Level Byte Pair Encoding)字节级字节对编码
LLM
 
BPE(Byte pair encoding)分词
NLP
 
DALL-E 3:OpenAI推出的先进图像生成系统
机器视觉
 
Detectron: Facebook AI Research(FAIR)开发的一个用于目标检测(Object Detection)和实例分割(Instance Segmentation)的开源框架
目标检测
 
框架
 
XLNet:一种基于Transformer架构的自回归语言模型
LLM
 
大语言模型的函数调用(function call)
LLM
 
GraphRAG(Graph - based Retrieval - Augmented Generation)
LLM
 
llama.cpp:以C++为主要编程语言的高性能开源库
LLM
 
开源库
 
MiniCPM
LLM
 
合成数据集
数据集
 
NVIDIA L20和NVIDIA A30
GPU
 
DeepSeek-R1-Zero 和 DeepSeek-R1
LLM
 
DeepSeek
 
python super
python
 
Smith-Waterman算法
算法
 
Voice Activity Detection(语音活动检测)
语音识别
 
论文:DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models
LLM
 
DeepSeek
 
架构图中的领域层
架构图
 
数据对账机制
业务
 
DeepAR:一种基于深度学习的时间序列预测算法
时间序列预测
 
SimVLM(Simple Visual Language Model)
VLM
 
多模态预训练架构UNIMO
多模态
 
mPLUG:阿里巴巴达摩院推出的一系列多模态模型
多模态
 
GraphGPS:Recipe for a General, Powerful, Scalable Graph Transformer
图神经网络
 
Graphormer:一种基于Transformer架构的图深度学习模型
图神经网络
 
R-Drop:一种用于深度学习模型训练的正则化方法
深度学习
 
LOW RANK ATTENTION(低秩注意力)
注意力机制
 
BART(Bidirectional and Auto-Regressive Transformers)
LLM
 
«
1
2
3
4
5
6
7
8
9
…
47
48
»