qingqing829
线性可分就是说可以用一个线性函数把两类样本分开,比如二维空间中的直线、三维空间中的平面以及高维空间中的线性函数。
所谓可分指可以没有误差地分开;线性不可分指有部分样本用线性分类面划分时会产生分类误差的情况。
在这种情况下,SVM就通过一个非线性映射函数把样本映射到一个线性可分高维空间,在此高维空间建立线性分类面,而此高维空间的现行分类面对应的就是输入空间中的非线性分类面。
判断是否线性可分:不同样本集用凸包包起来,判断不同凸包的边是否有交叉。
扩展资料:
判断线性可分和线性不可分——凸包
1、中心法
先构造一个中心点,然后将它与各点连接起来,按斜率递增的方法,求出凸包上部;再按斜率递减的方法,求出凸包下部。
2、水平法
从最左边的点开始,按斜率递增的方法,求出凸包上部;再按斜率递减的方法,求出凸包下部。水平法较中心法减少了斜率无限大的可能,减少了代码的复杂度。
3、快包法
选择最左、最右、最上、最下的点,它们必组成一个凸四边形(或三角形)。这个四边形内的点必定不在凸包上。然后将其余的点按最接近的边分成四部分,再进行快包法(QuickHull)。
参考资料:百度百科-凸包
大料酱VS小麋鹿
呵呵,线性可分是模式识别里的概念阿。简单的说就是如果用一个线性函数可以将两类样本完全分开,就称这些样本是“线性可分”的。英文叫做linearly separable。这里不方便写公式,你可以直观想象二维空间划一条直线把两类样本隔开,这两类就称为线性可分样本。如果两类样本象下面这么分布:o.........x..x.........o就找不到一条直线能把o和x分开了,这时候就称为线性不可分。更进一步的理解,建议你参考任何一本模式识别的专著,里面讲到线性分类器或SVM的时候都会提到的。