联系我们

数据科学

了解KNN算法的快速指南

mm

更新

 on

随着商业世界的积极采用 数据科学 ,它已成为最受欢迎的领域之一。我们解释什么是K近邻算法及其工作原理。

什么是KNN算法?

K最近邻居算法 (或KNN)由于其简单性而成为最常用的学习算法之一。 知识网络 或K最近邻算法是 监督学习 该算法的工作原理是,彼此接近的每个数据点都属于同一类。这里的基本假设是彼此靠近的事物彼此相似。大多数情况下,使用KNN算法是因为其易于解释且计算时间短。

知识网络 被广泛用于以下领域的分类和回归问题 机器学习 。 知识网络 的一些示例是电子商务门户网站用来推荐相似产品的算法。

让’s Review an Example:

在给定的图像中,我们有两类数据。 A类代表正方形,B类代表三角形。

问题是使用KNN算法将新的输入数据点分配给两个类之一

第一步是定义“ K”的值,该值代表最近邻居的数量。

如果“ k”的值为6,它将寻找到该数据点最近的6个邻居。如果“ k”的值为5,它将寻找到该数据点最近的5个邻居。

让’s考虑“ K” = 4,这意味着该算法将考虑最接近数据点的四个邻居。

现在,在“ K” = 4处,可以将一个三角形和两个正方形视为最近的邻居。因此,将基于“ K” = 4的新数据点分配给A类。

在哪里使用KNN?

知识网络 用于分类和回归预测问题。但是,当将其用于工业目的时,大多数将其用于分类中,因为它在确定技术的可用性时会影响评估的所有参数。

  1. 预测能力
  2. 计算时间
  3. 易于解释输出

在日常问题中如何使用它?

尽管具有简单性,但KNN的工作方式却比其他强大的分类器更好,并且在诸如经济预测和数据压缩,视频识别,图像识别,手写检测和语音识别等地方使用。

知识网络 算法的一些主要用途

知识网络 算法在银行系统中用于通过预测某人是否具有违约者的特征来预测该人是否适合贷款审批。通过将KNN与具有相似特征的人进行比较,KNN还可以帮助计算个人的信用评分。

使用KNN的公司

在推荐购买产品或观看电影/电视节目时,像Amazon或Netflix这样的大多数电子商务和娱乐公司都使用KNN。

他们甚至如何提出这些建议?好吧,这些公司收集有关用户的数据’的行为,例如您以前购买的产品或在其网站上观看并应用KNN的电影。

这些公司将输入您的可用客户数据,并将其与购买了类似产品或看过类似电影的其他客户进行比较。

然后,将根据算法将数据点分类的方式向您推荐产品和电影。

知识网络 的优缺点

知识网络 的优势

  • 快速计算
  • 简单的算法-解释
  • 多功能–适用于分类和回归
  • 高精确度
  • 无需任何数据假设-无需进行其他假设或建立模型。

知识网络 的缺点

  • 准确性取决于数据的质量
  • 大数据预测变得缓慢
  • 与大数据集无关
  • 需要存储所有训练数据,因此需要大量内存
  • 由于它存储了所有训练,因此在计算上可能会很昂贵

在此博客中,我们试图解释了广泛用于分类的K-NN算法。我们讨论了KNN背后的基本方法,其工作方式以及优缺点。

知识网络 算法是最简单的算法之一,可以给出非常积极的结果。 知识网络 算法可用于分类和回归问题。

拥有超过8年IT行业专业经验的数据科学家人员。胜任数据科学和数字营销。专业研究技术内容的专业知识。