深度学习入门（上）-第一章必备基础知识点-白红宇

深度学习入门（上）-第一章必备基础知识点

阅读量：4155 次

发布时间：2019-05-26

本文共 4006 字，大约阅读时间需要 13 分钟。

1.深度学习与人工智能简介

大数据时代造就了人工智能的发展，人工智能的时代已经来临。数据规模越大，深度学习算法越好。深度学习有诸多应用，如诉说图片故事，自动驾驶等等。

2.CV面临的挑战与常规套路

图像分类是CV核心任务。图片是由若干个像素点组成的，一张图片被表示成3维数组的形式，每个像素的值[0，255]。像素点与亮度有关，像素点值越大，亮度就越大。

挑战：viewpoint variation, illumination conditions, scale variation, deformation, background clutter, occlusion, intra-class variation.

常规套路：数据驱动方法，即

收集data并打label。（将data和label进行一一对应的操作）

train一个分类器。在deep learning 中，这个分类器就是神经网络。

test 和评估。

def train(train_images, train_labels):    # build a model for images-labels..    return modeldef predict(model, test_images):    # predict test_labels using the model..    return test_labels

3.用K近邻来进行图像分类

指定K值，看当前物体离谁比较近，离谁近的越多，我们就说等于谁。

KNN运作流程

对于未知类别属性数据集中的点与当前点的距离

按照距离依次排序

选取与当前点距离最小的K个点

确定前K个点所在类别的出现概率

返回前K个点出现频率最高的类别作为当前点的预测分类

KNN特点：
简单有效，lazy-learning
无训练操作。分类器不需要使用training set进行training，训练时间复杂度为0.
KNN分类的计算复杂度和traing set中的文档数目成正比，即若training set中文档总数为n，那么KNN的分类时间复杂度为0(n).

KNN算法的三个基本要素：K值的选择，距离度量，分类决策规则。

KNN方法在分类时的主要不足：当样本不平衡时，如一个类的样本容量很大，而其他类样本容量很小时，有可能导致当输入一个新样本时，该样本的K个邻居中大容量类的样本占多数。

解决方法：不同的样本给予不同的权重。

此外，KNN算法虽然简易，但需要存储所有的training data，且在test时过于耗费计算能力。

为了用很小的时间代价，把分类任务完成，推荐使用CIFAR-10数据集，介绍：10类标签（airplane, automobile, bird, cat, deer, dog, frog, horse, ship, truck）,50000个training data，10000个test data，大小均为32*32.

如何用KNN进行图像分类呢？

计算距离：

用K近邻算法做图像分类的代码实现(k=1)：
Note：仅仅使用L1或者L2进行像素比较是有问题的，图像更多的是按照背景和颜色被分类，而不是语义主体本身，所以不提倡使用这种方法完成图像分类的任务。

import numpy as npclass NearestNeighbor:    def __init__(self):        pass    def train(self, X, y):    # knn无须训练，所以直接把数据和标签存起来即可        self.Xtr = X        self.ytr = y    def predict(self, X):    # 对于每一个测试数据，在training data中找出与其L1距离最小的样本的标签，作为其标签。        num_test = X.shape[0]        Ypred = np.zeros(num_test, dtype = self.ytr.dtype)        for i in xrange(num_test):            distances = np.sum(np.abs(self.Xtr - X[i,:]), axis = 1)            min_index = np.argmin(distances)            Ypred[i] = self.ytr[min_index]        return Ypred

这里，L1距离实际上是一种超参数

4.超参数与交叉验证

距离是一种超参数。

现在有一些关于超参数的问题。

如何设定距离，使用L1还是L2？

KNN中K如何选择？

如果有其他超参数的话，如何设定其他超参数？

解决方法：

首先要明确的是：test set是非常宝贵的，不能用测试集调节参数，test set只能最后用。所以，往往采用交叉验证的方式来找到合适的参数。推荐使用交叉验证的方式来进行模型的建立。

1.选取超参数的正确方法是：将原始training set分为training set 和 validation set，在验证集上尝试不同的超参数，随后选取最优超参数。
2.若训练数据不够，可使用交叉验证的方法，帮助在选取最优超参数时减少噪声。
3.一旦找到最优超参数，就让算法以该参数在test set上跑，且只跑一次。然后，根据测试结果评价算法。

5.线性分类

还是做分类这件事，要得到属于每个类别的概率值（得分值）。