非线性二分类——机器学习


 
import matplotlib.pyplot as plt
import numpy as np
from sklearn.metrics import classification_report
from sklearn import tree
from sklearn.model_selection import train_test_split
import graphviz
#载入数据
data = np.genfromtxt('test2.csv',delimiter=',')
x_data = data[:,:-1]
y_data = data[:,-1]
plt.scatter(x_data[:,0],x_data[:,-1],c=y_data)
plt.show()
#分割数据
x_train,x_test,y_train,y_test = train_test_split(x_data,y_data)
#创建决策树模型
model = tree.DecisionTreeClassifier()
model.fit(x_data,y_data)
#导出决策树
dot_data = tree.export_graphviz(model,
                                out_file=None,
                                #特征的名字，要设置
                                feature_names = ['x','y'],
                                class_names=['label0','label1'],
                                filled=True,
                                rounded=True,
                                special_characters=True)
graph = graphviz.Source(dot_data)
graph.render('cart_1')
#获取数据值所在范围
x_min,x_max = x_data[:,0].min() - 1,x_data[:,0].max() + 1
y_min,y_max = x_data[:,1].min() - 1,x_data[:,1].max() + 1
#生成网格矩阵
xx,yy = np.meshgrid(np.arange(x_min,x_max,0.02),
                    np.arange(y_min,y_max,0.02))
z = model.predict(np.c_[xx.ravel(),yy.ravel()])
#扁平化，得到一个一个的点
#ravel和flatten类似，多维数据转一维，flatten不会改变原始数据，而ravel会
z = z.reshape(xx.shape)
#等高线图
#在这里，只有两个高度，0和1
cs = plt.contourf(xx,yy,z)
#样本散点图
plt.scatter(x_data[:,0],x_data[:,1],c=y_data)
plt.show()

五、运行结果及分析

六、总结

线性分类器可解释性好，计算复杂度较低，不足之处是模型的拟合效果相对弱些。

非线性分类器效果拟合能力较强，不足之处是数据量不足容易过拟合、计算复杂度高、可解释性不好。

相关阅读:
【Linux网络编程】epoll进阶之水平模式和边沿模式
要么干要么滚！推特开始裁员了；深度学习产品应用·随书代码；可分离各种乐器音源的工具包；Transformer教程；前沿论文 | ShowMeAI资讯日报
java计算机毕业设计网课系统源码+系统+mysql数据库+LW文档+部署文件
mongodb的基本知识点
数据治理是一个怎样的体系化的过程？_光点科技
探索GPT-4V在学术领域的应用——无需编程即可阅读和理解科学论文
一个简单的dw网页制作作业，学生个人html静态网页制作成品代码——怪盗基德动漫主题网页成品（15页）
院内导航怎么实现？哪家技术好？医院导航移动导诊服务系统
charles抓包
Linux在线安装MySQL8.0.24安装、MySQL数据备份和恢复

原文地址：https://blog.csdn.net/qq_50942093/article/details/128022984