张量

张量定义

  • 张量,可理解为一个 n 维矩阵,所有类型的数据,包括标量、矢量和矩阵等都是特殊类型的张量。

张量的三种类型

TensorFlow 支持以下三种类型的张量:

  • 常量:常量是其值不能改变的张量。
  • 变量:当一个量在会话中的值需要更新时,使用变量来表示。例如,在神经网络中,权重需要在训练期间更新,可以通过将权重声明为变量来实现。变量在使用前需要被显示初始化。另外需要注意的是,常量存储在计算图的定义中,每次加载图时都会加载相关变量。换句话说,它们是占用内存的。另一方面,变量又是分开存储的。它们可以存储在参数服务器上。
  • 占位符:用于将值输入 TensorFlow 图中。它们可以和 feed_dict 一起使用来输入数据。在训练神经网络时,它们通常用于提供新的训练样本。在会话中运行计算图时,可以为占位符赋值。这样在构建一个计算图时不需要真正地输入数据。需要注意的是,占位符不包含任何数据,因此不需要初始化它们。

常量

  • 声明一个标量常量:
t_1 = tf.constant(4)
  • 一个形如 [1,3] 的常量向量可以用如下代码声明:
t_2 = tf.constant([4,3,2])
  • 要创建一个所有元素为零的张量,可以使用 tf.zeros() 函数。这个语句可以创建一个形如 [M,N] 的零元素矩阵,数据类型(dtype)可以是 int32、float32 等:
tf.zeros([M,N],tf.dtype)

例如:

zero_t = tf.zeros([2,3],tf.int32)
# Results in an 2x3 array of zeros:[[0 0 0],[0 0 0]]

变量

变量的定义

  • tf.Variable()

变量保存

  • 使用 Saver 类来保存变量,定义一个 Saver 操作对象:

占位符

占位符定义

  • tf.placeholder(dtype,shape=None,name=None)

占位符用途

  • 占位符用于将数据提供给计算图。

拓展阅读

  • 很多时候需要大规模的常量张量对象;在这种情况下,为了优化内存,最好将它们声明为一个可训练标志设置为 False 的变量。