Mathew Farmer
Mathew Farmer
AI ethics consultant and policy advisor. AI伦理顾问兼政策专家。AI倫理コンサルタント、政策顧問。Berater für KI-Ethik und Politik.
好的,没问题。这个问题其实用生活中的例子来理解会非常简单。
监督学习 (Supervised Learning):跟着“老师”学
想象一下你小时候是怎么学习认水果的。
你妈妈会拿起一个苹果,告诉你:“看,这个红色的、圆圆的,叫‘苹果’🍎”。然后又拿起一根香蕉,告诉你:“这个黄色的、长长的,叫‘香蕉’🍌”。
这个过程里,“妈妈”就是老师,她给了你 “物体(水果)” 和 “答案(名称)”。经过这样大量的“指认”练习后,你就学会了。下次再看到一个苹果,即使是你没见过的品种,你也能认出来:“这是苹果!”
监督学习就是这个道理。
我们给机器学习一堆已经“标好答案”的数据。比如,给它成千上万张图片,有的标记为“猫”,有的标记为“狗”。机器通过学习这些“图片”和“标签”之间的关系,总结出规律。
- 学习资料:带标签的数据(例如:图片 + “猫”/“狗”的标签)
- 学习目标:学会预测。当一张新图片(没有标签)进来时,它能准确地预测出它的标签是“猫”还是“狗”。
生活中的例子:
- 垃圾邮件过滤:你手动标记“这是垃圾邮件”,就是在给算法提供带标签的数据。
- 人脸识别:用你已经标记了名字的照片去训练模型。
- 房价预测:根据房子的“面积、位置、年份”(特征)和对应的“价格”(标签)来学习。
无监督学习 (Unsupervised Learning):自己“找规律”
现在换一种场景。
假设你是一个从来没见过水果的人,有人给了你一大筐水果,里面有苹果、香蕉、橘子、葡萄,但没人告诉你它们分别叫什么。
你怎么办?你可能会自己琢磨,然后根据一些特点把它们分分类。
“嗯...这些红色的、圆的放一堆。那些黄色的、长条的放另一堆。这些紫色的、一串一串的又是一堆。”
你虽然不知道它们叫什么,但你靠自己发现了数据中的规律和结构,并把相似的东西归到了一起。
无监督学习就是这个道理。
我们只给机器一堆数据,不给它任何“答案”或“标签”。机器需要自己动脑筋,去发现数据中隐藏的模式或群组。
- 学习资料:不带标签的数据(例如:一大堆用户的购买记录)
- 学习目标:发现结构。比如,将行为相似的用户自动划分为不同的群组。
生活中的例子:
- 用户分群:电商网站根据用户的购买历史、浏览行为,将用户自动分成“高消费潜力股”、“价格敏感型”、“打折爱好者”等不同群体,以便进行精准营销。
- 新闻聚合:新闻App自动将报道同一事件的不同新闻稿件聚合在一起。
- 异常检测:在大量的交易数据中,自动发现不符合常规模式的“可疑交易”。
一句话总结
- 监督学习:给机器带标准答案的练习册(数据+标签),让它学会预测。
- 无监督学习:给机器一堆杂乱的资料(只有数据),让它自己去发现其中的分类和规律。