吴恩达课程系列
1-3监督学习【监督学习的定义,监督学习的分类(回归与分类)】
1-4无监督学习【无监督学习的定义,无监督学习问题的分类(聚类/信号分离/降维)】
2-1 模型描述Model Representation
以之前的房屋交易问题为例,假使我们回归问题的训练集(Training Set)如下表所示:
我们将要用来描述这个回归问题的标记如下:
\(m\) 代表训练集中实例的数量 , 比如上面这个表格有47行,那么m=47
\(x\) 代表特征/输入变量
\(y\) 代表目标变量/输出变量
\((x,y)\) 代表训练集中的实例
\((x^{(i)},y^{(i)} )\) 代表第 i 个观察实例,i是一个索引。比如上面这个数据集, \(x^{(1)}=2104, x^{(2)}=1416, y^{(1)}=460....\)
\(h\) 代表学习算法的解决方案或函数也称为假设(hypothesis)
因而,要解决房价预测问题,我们实际上是要将训练集“喂”给我们的学习算法,进而学习得到一个假设 \(h\),然后将我们要预测的房屋的尺寸作为输入变量输入给 \(h\),预测出该房屋的交易价格作为输出变量输出为结果。那么,对于我们的房价预测问题,我们该如何表达 \(h\)?
一种可能的表达方式为:\(h_{\theta}=\theta_0+\theta_1x\),因为只含有一个特征/输入变量,因此这样的问题叫作单变量线性回归(Univariate Linear Regression)问题。