前言
朴素贝叶斯算法是通过贝叶斯公式及条件的独立性建立的一个生成模型,具体内容及原理参见李航《统计学习方法》,下面对朴素贝叶斯算法通过python 实现。因为本人是数学专业非科班,所以很多代码显得很冗余,因为只用了一些基本的方法所以有些函数的定义显得比较多余,但通过基本的方法有些时候更加能够明白代码实现的原理,作为刚入门的笔者希望通过少掉包的方式端倪按自己的算法逻辑,学习思路和代码仅供参考。
朴素贝叶斯算法的实现
1.数据集
数据来自李航《统计学习方法》p50,例4.1
2.代码实现
代码如下:
import numpy as npimport pandas as pdfrom pip import main# 通过该函数获得每个可能的x每个分量可能的取值和y的取值def getDim(data):if(data.shape[0] == 0): # 判断向量是否为空return 0lis = [data[0]] # 获取列向量的第一个元素for i in range(data.shape[0]):if(data[i