遇到问题:
报错
学习内容
1、拉普拉斯平滑
零概率问题,就是在计算实例的概率时,如果某个量x,在观察样本库(训练集)中没有出现过,会导致整个实例的概率结果是0,不能因为一个事件没有观察到就武断的认为该事件的概率是0。
解决方法
使用加 lambda(1≥lambda≥0)来代替简单加1,此时分母也要记得加上N*lambda
2、pd.read_csv() 读取文件时报错误,可尝试
with open(r"C:\Users\hp\Desktop\1\film\train.csv") as f: train = pd.read_csv(f) f.close()