【MachineLearning】Neural Networks:Representation——Multiclass Classification

在实际问题中我们可能遇到不只是二分类的问题,有可能是多类别的分类,在上一节中我们最后说到的手写数字识别,就是一个多分类问题(数字0到9)。本节我们将继续讲节有关的多类分类问题。

Multiple output units:One-vs-all

下面这个例子不只是识别汽车,还有行人,摩托车,卡车。

QQ截图20141029211548

观察上图:

  • 这个图的假设函数(hypothesis function)将会输出一个四个数字组成的向量。
  • 最后一层(output layer)将会输出一个四个元素的向量,从上到下依次代表行人(对应的假设函数输出的向量约等于是[1; 0; 0; 0]),小汽车([0; 1; 0; 0]),摩托车([0; 0; 1; 0])以及卡车([0; 0; 0; 1])。
  • 最后一层(输出层)就是四个logistic regression分类器,我们需要对四个分类器中的每一个都分别进行识别分类。

Multiple output units:One-vs-all

还是针对上图的解释,现在跳转到下面这张图=w=。

QQ截图20141029215648

 

观察上图:

  1. 之前我们是通过y∈{1,2,3,4}来表示类别的,现在我们不这么表示,而是使用这样的方式,例如y(i) = [1; 0; 0; 0]表示行人等等。
  2. 这样一来,我们的训练样本将成为(x(i),y(i))这一对数,其中x(i)是四种物体中的一个,而y(i)是四个向量中的某一个。
  3. 最后我们将输出假设函数(hypothesis function),其值近似约等于y。在我们的例子中,h(x)和y(i)它们都是四维向量,因为我们有四个类别。
  4. 注意:通常隐含层都有偏执单元。(下面这个Quiz就与这个有关)

Quiz Elements of the Θ

Suppose you have a multi-class classification problem with 10 classes. Your neural network has 3 layers, and the hidden layer (layer 2) has 5 units. Using the one-vs-all method described here, how many elements does Θ(2) have?

 

本节我们讲了如何基于我们的表达式来表征神经网络,在下一章节——IX. Neural Networks: Learning (Week 5)中,我们将会讲到如何得到神经网络的训练集以及怎样自动学习神经网络的参数。

发表评论

电子邮件地址不会被公开。 必填项已用*标注