联系我们

AI 101

什么是贝叶斯定理?

mm

更新

 on

如果您一直在学习 数据科学 要么 机器学习,很可能您已经听说过 术语“贝叶斯定理” 之前,或“贝叶斯分类器”。这些概念可能会使您感到困惑,尤其是如果您不习惯从传统的频繁统计数据角度思考概率问题时。本文将尝试解释贝叶斯定理的原理及其如何’用于机器学习。

什么是贝叶斯定理?

贝叶斯定理是 计算条件概率。计算条件概率(给定一个不同事件的发生,一个事件发生的概率)的传统方法是使用条件概率公式,计算同时发生的事件一和事件二的联合概率,然后除以发生两次事件的可能性。但是,也可以通过使用贝叶斯定理以稍微不同的方式计算条件概率。

使用贝叶斯定理计算条件概率时,请使用以下步骤:

  • 假设条件A为真,则确定条件B为真的概率。
  • 确定事件A为真的概率。
  • 将两个概率相乘。
  • 除以事件B发生的可能性。

这意味着贝叶斯定理的公式可以表示为:

P(A | B)= P(B | A)* P(A)/ P(B)

当可以很容易地计算出反向条件概率,或者计算联合概率过于困难时,这样计算条件概率特别有用。

贝叶斯定理的例子

如果我们花一些时间看一看,这可能更容易解释。 贝叶斯推理和贝叶斯定理的应用方法。假设您正在玩一个简单的游戏,其中有多个参与者向您讲述一个故事,并且您必须确定哪个参与者对您说谎。在这种假设的情况下,让我们用变量填写贝叶斯定理的方程式。

我们正在尝试预测游戏中的每个人是在撒谎还是在说真话,因此,如果您之外有三名玩家,则分类变量可以表示为A1,A2和A3。他们的谎言/真相的证据就是他们的行为。就像在玩扑克时一样,您会寻找某人在撒谎的某些“诉说”,并将其用作信息来告知您的猜测。或者,如果您被允许质疑他们,那将是他们的故事没有任何证据的证据。我们可以代表一个人以B说谎的证据。

明确地说,我们的目的是预测概率(A会说谎/告诉事实,并提供其行为的证据)。为此,我们想计算出B给予A的概率,或者考虑到该人真正撒谎或说出真相而发生其行为的概率。您正在尝试确定在哪种情况下您所见到的行为最有意义。如果您目睹了三种行为,则将为每种行为进行计算。例如,P(B1,B2,B3 * A)。然后,对于游戏中除您自己以外的每个人,每次出现A /时,您都要这样做。这就是上面等式的一部分:

P(B1,B2,B3,| A)* P | A

最后,我们将其除以B的概率。

如果我们收到有关该方程式中实际概率的任何证据,则将考虑新证据重新创建我们的概率模型。这称为更新先验,因为您更新了关于观察到的事件发生的先验概率的假设。

贝叶斯定理的机器学习应用

贝叶斯定理最常见的用法 涉及机器学习 采用朴素贝叶斯算法的形式。

朴素贝叶斯用于二进制数据集和多类数据集的分类,朴素贝叶斯之所以得名,是因为分配给证人的值是证据/属性–P(B1,B2,B3 * A)中的Bs–假设彼此独立。假设这些属性不会相互影响,以便简化模型并进行计算,而不是尝试执行复杂的任务来计算每个属性之间的关系。尽管采用了简化的模型,但即使这种假设可能不正确(大多数情况下也是如此),朴素贝叶斯仍然可以作为分类算法很好地执行。

也有 常用变体 朴素贝叶斯分类器,例如多项朴素贝叶斯,伯努利朴素贝叶斯和高斯朴素贝叶斯。

多项式朴素贝叶斯 算法通常用于对文档进行分类,因为它可以有效地解释文档中单词的出现频率。

伯努利·朴素贝叶斯 其操作类似于多项式朴素贝叶斯,但该算法提供的预测为布尔值。这意味着在预测类别时,值将为二进制,否或是。在文本分类的领域中,伯努利·朴素贝叶斯算法将根据是否在文本文档中找到单词,将参数分配为是或否。

如果预测指标/功能的价值不是离散的,而是连续的, 高斯朴素贝叶斯 可以使用。假设连续要素的值是从高斯分布中取样的。

专门从事以下工作的Blogger和程序员 机器学习 深度学习 话题。 Daniel希望帮助他人将AI的力量用于社会公益。