MTL - Multi-task Learning（多任务学习）

标签: DNN 更新于: 2020/04/06 阅读:1412

多任务学习

多任务学习可以认为是归纳知识迁移，通过共享互补任务的域信息提升泛化性能。

MultiNet
CrossStitch
PoseNet
UberNet

简单求和

不同tasks的loss function，简单求和。当模型收敛时，有一些task的表现比较好，而另外一些task的表现却惨不忍睹。其背后的原因是不同的损失函数具有不同的尺度，某些损失函数的尺度较大，从而影响了尺度较小的损失函数发挥作用。

加权求和

加权的超参难以确定。

《Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics》

学习率调整

all_variables = shared_vars + a_vars + b_vars
all_gradients = tf.gradients(loss, all_variables)

shared_subnet_gradients = all_gradients[:len(shared_vars)]
a_gradients = all_gradients[len(shared_vars):len(shared_vars + a_vars)]
b_gradients = all_gradients[len(shared_vars + a_vars):]

shared_subnet_optimizer = tf.train.AdamOptimizer(shared_learning_rate)
a_optimizer = tf.train.AdamOptimizer(a_learning_rate)
b_optimizer = tf.train.AdamOptimizer(b_learning_rate)

train_shared_op = shared_subnet_optimizer.apply_gradients(zip(shared_subnet_gradients, shared_vars))
train_a_op = a_optimizer.apply_gradients(zip(a_gradients, a_vars))
train_b_op = b_optimizer.apply_gradients(zip(b_gradients, b_vars))

train_op = tf.group(train_shared_op, train_a_op, train_b_op)

参考

MTL的三个小知识

MTL - Multi-task Learning（多任务学习）

目录

多任务学习

简单求和

加权求和

学习率调整

参考

DNN相关文章

最近热门

最常浏览