2-1 模型描述

如何描述一个模型,单变量线性回归是什么

Posted by Hilda on March 2, 2025

吴恩达课程系列

1-1 欢迎参加《机器学习》课程【机器学习简介/例子】

1-2 什么是机器学习【机器学习的2个定义和分类】

1-3监督学习【监督学习的定义,监督学习的分类(回归与分类)】

1-4无监督学习【无监督学习的定义,无监督学习问题的分类(聚类/信号分离/降维)】

2-1 模型描述Model Representation

以之前的房屋交易问题为例,假使我们回归问题的训练集(Training Set)如下表所示:

image-20250302132852401

我们将要用来描述这个回归问题的标记如下:

\(m\) 代表训练集中实例的数量 , 比如上面这个表格有47行,那么m=47

\(x\) 代表特征/输入变量

\(y\) 代表目标变量/输出变量

\((x,y)\) 代表训练集中的实例

\((x^{(i)},y^{(i)} )\) 代表第 i 个观察实例,i是一个索引。比如上面这个数据集, \(x^{(1)}=2104, x^{(2)}=1416, y^{(1)}=460....\)

\(h\) 代表学习算法的解决方案或函数也称为假设(hypothesis)

image-20250302133145029

因而,要解决房价预测问题,我们实际上是要将训练集“喂”给我们的学习算法,进而学习得到一个假设 \(h\),然后将我们要预测的房屋的尺寸作为输入变量输入给 \(h\),预测出该房屋的交易价格作为输出变量输出为结果。那么,对于我们的房价预测问题,我们该如何表达 \(h\)?

一种可能的表达方式为:\(h_{\theta}=\theta_0+\theta_1x\),因为只含有一个特征/输入变量,因此这样的问题叫作单变量线性回归(Univariate Linear Regression)问题。