厦门石材网站建设,服饰 企业 网站建设,空间设计方案,大学生网页设计贝叶斯公式在A 条件成立下#xff0c;B的概率等于B的概率*在B条件成立下#xff0c;A的概率/A的概率#xff0c;推导假设一个学校中男生占总数的60%#xff0c;女生占总数的40%。并且男生总是穿长裤#xff0c;女生则一半穿长裤、一半穿裙子。1.正向概率。随机选取一个学生…贝叶斯公式在A 条件成立下B的概率等于B的概率*在B条件成立下A的概率/A的概率推导假设一个学校中男生占总数的60%女生占总数的40%。并且男生总是穿长裤女生则一半穿长裤、一半穿裙子。1.正向概率。随机选取一个学生他她穿长裤和穿裙子的概率是多大这就简单了题目中已经告诉大家男生和女生对于穿着的概率。2.逆向概率。迎面走来一个穿长裤的学生你只看得见他她穿的是否是长裤而无法确定他她的性别你能够推断出他她是女生的概率有多大性别长裤裙子男60%100%0%女40%50%50%假设总学生为U穿长裤的男生的个数为U*60%*100%穿长裤的女生个数为:U*40%*50%第2问的问题是穿长裤的女生的概率首先计算穿长裤的总人数穿长裤的女生的概率合并得分母表示男生中穿长裤的人数和女生中穿长裤的人数的总和就是P(Pants)假设穿长裤用A表示女生用B表示伯努利朴素贝叶斯APIsklearn.naive_bayes.BernoulliNB高斯朴素贝叶斯APIsklearn.naive_bayes.GuassianNB多项式朴素贝叶斯APIsklearn.naive_bayes.MultinomialNB实例1、处理鸢尾花数据为连续性数据应使用高斯朴素贝叶斯from sklearn.naive_bayes import MultinomialNB,BernoulliNB,GaussianNB
import pandas as pd
from sklearn.model_selection import train_test_split#读取数据
path rD:\python\2023\机器学习\分类data\iris.csv
df pd.read_csv(path)
df.columns [type1,type2,type3,type4,target]
#df load_iris()
#print(df)
#取出目标值及特征值
y df[target]
x df.drop(target,axis1)
print(x)
#将数据进行分为训练集及测试集
x_train,x_test,y_train,y_test train_test_split(x,y,train_size0.25)
#特征工程#数据建模算法
bys GaussianNB()
bys.fit(x_train,y_train)
y_predict bys.predict(x_test)
print(预测结果,y_predict)
print(高斯朴素贝叶斯的正确率为:,bys.score(x_test,y_test))若用多项式朴素贝叶斯from sklearn.naive_bayes import MultinomialNB,BernoulliNB,GaussianNB
import pandas as pd
from sklearn.model_selection import train_test_split#读取数据
path rD:\python\2023\机器学习\分类data\iris.csv
df pd.read_csv(path)
df.columns [type1,type2,type3,type4,target]
#df load_iris()
#print(df)
#取出目标值及特征值
y df[target]
x df.drop(target,axis1)
print(x)
#将数据进行分为训练集及测试集
x_train,x_test,y_train,y_test train_test_split(x,y,train_size0.25)
#特征工程#数据建模算法
bys MultinomialNB()#默认alpha1.0
bys.fit(x_train,y_train)
y_predict bys.predict(x_test)
print(预测结果,y_predict)
print(多项式朴素贝叶斯的正确率为:,bys.score(x_test,y_test))2、多项式朴素贝叶斯处理新闻数据from sklearn.datasets import fetch_20newsgroups
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.model_selection import train_test_splitnews fetch_20newsgroups(subsetall)
#数据分割
x_train,x_test,y_train,y_test train_test_split(news.data,news.target,test_size0.25)#特征抽取
tf TfidfVectorizer()
#以训练集当中的词的列表进行每篇文章重要性统计
x_train tf.fit_transform(x_train)print(tf.get_feature_names())x_test tf.transform(x_test)#进行多项式朴素贝叶斯预测
mlt MultinomialNB(alpha1.0)
print(x_train)
mlt.fit(x_train,y_train)
y_predict mlt.predict(x_test)print(预测文章类别是,y_predict)
print(准确率是,mlt.score(x_test,y_test))