什么是回归问题?请举例说明。

Kelly Pollard
Kelly Pollard
Lead AI researcher with 15 years experience. 首席人工智能研究员,15年经验。主任AI研究員、15年の経験。Leitender KI-Forscher, 15 Jahre Erfahrung.

哈喽,我来试着解释一下这个问题,希望能帮到你。

什么是回归问题?

你可以这么理解:在机器学习里,我们经常需要做预测。预测的目标可以分为两种:

  1. 预测一个类别:比如预测一封邮件是“垃圾邮件”还是“正常邮件”,或者一张图片里是“猫”还是“狗”。这种问题就像做选择题,答案是几个固定的选项之一。这叫分类问题
  2. 预测一个具体的数值:比如预测明天的气温是多少度,或者一套房子的价格是多少万。这种问题就像做填空题,答案是一个连续变化的数字。这,就是回归问题

所以,回归问题(Regression Problem) 说白了就是预测一个连续的、具体的数值。它的目标是找出一个“公式”或者“模型”,来搞清楚一堆影响因素(我们叫它“特征”)和一个结果数值(我们叫它“标签”)之间的关系。


举几个生活中的例子

这样说可能还是有点抽象,我们来看几个具体的例子就明白了。

例子一:预测房价(最经典的例子)

这是回归问题最常见的应用了。

  • 你要预测什么?
    • 一套房子的具体价格,比如 123.5万。这是一个具体的数值。
  • 你需要哪些信息来帮助你预测?
    • 房子的面积(平方米)
    • 有几个卧室
    • 房子的地段(比如离市中心多远)
    • 房子的楼层
    • 建成年份
  • 怎么做?
    • 机器学习模型会学习成千上万套已经成交的房子的信息和它们的最终价格。通过学习,它会找到面积、地段等因素和房价之间的数学关系。
    • 当你给它一套新房子的信息时,它就能根据学到的关系,给你估算出一个具体的价格。

例子二:预测明天的气温

天气预报就是一个典型的回归应用。

  • 你要预测什么?
    • 明天中午12点的具体温度,比如 26.5℃
  • 你需要哪些信息来帮助你预测?
    • 今天的温度、湿度、风速
    • 历史同期的天气数据
    • 气压
  • 怎么做?
    • 模型学习历史气象数据,找出这些因素和未来温度变化之间的规律,从而预测一个具体的温度值。

例子三:预测视频的播放量

作为一个视频创作者,你可能想知道新发布的视频能有多少播放量。

  • 你要预测什么?
    • 视频发布后24小时内的播放量,比如 58,432次
  • 你需要哪些信息来帮助你预测?
    • 视频的时长
    • 视频的标签(Tag)
    • 发布时间(是周五晚上还是周一早上?)
    • 你过往视频的平均表现
  • 怎么做?
    • 模型分析你(或者所有创作者)过往视频的各种特征和它们对应的播放量,找到一个能预测播放量的模式。

简单总结一下

回归 (Regression)分类 (Classification)
目标预测一个具体的数值预测一个固定的类别
问题“是多少?” (How much/How many?)“是哪个?” (Which one?)
例子房价、气温、分数是不是垃圾邮件、图片里是猫还是狗

希望这个解释能让你更容易理解什么是回归问题!