codecamp

scikit-learn 转换预测目标(y)

这些转换器不打算用于特征,而只能用于有监督的学习目标。如果要转换预测目标以进行学习,但请在原始(未转换)空间中评估模型,另请参见在回归中转换目标

6.9.1 标签二值化

LabelBinarizer 是一个实用程序类,可从多类标签列表中创建标签指示矩阵:

>>> from sklearn import preprocessing
>>> lb = preprocessing.LabelBinarizer()
>>> lb.fit([1, 2, 6, 4, 2])
LabelBinarizer()
>>> lb.classes_
array([1, 2, 4, 6])
>>> lb.transform([1, 6])
array([[1, 0, 0, 0],
       [0, 0, 0, 1]])

对于多标签实例,请使用MultiLabelBinarizer

>>> lb = preprocessing.MultiLabelBinarizer()
>>> lb.fit_transform([(1, 2), (3,)])
array([[1, 1, 0],
       [0, 0, 1]])
>>> lb.classes_
array([1, 2, 3])

6.9.2 标签编码

LabelEncoder是一个实用程序类,可帮助标准化标签,使其仅包含0到n_classes-1之间的值。有时对于编写有效的Cython例程很有用。LabelEncoder可以如下使用:

>>> from sklearn import preprocessing
>>> le = preprocessing.LabelEncoder()
>>> le.fit([1, 2, 2, 6])
LabelEncoder()
>>> le.classes_
array([1, 2, 6])
>>> le.transform([1, 1, 2, 6])
array([0, 0, 1, 2])
>>> le.inverse_transform([0, 0, 1, 2])
array([1, 1, 2, 6])

它也可以用于将非数字标签(只要它们是可哈希的和可比较的)转换为数字标签:

>>> le = preprocessing.LabelEncoder()
>>> le.fit(["paris", "paris", "tokyo", "amsterdam"])
LabelEncoder()
>>> list(le.classes_)
['amsterdam', 'paris', 'tokyo']
>>> le.transform(["tokyo", "tokyo", "paris"])
array([2, 2, 1])
>>> list(le.inverse_transform([2, 2, 1]))
['tokyo', 'tokyo', 'paris']


scikit-learn 成对度量,近似关系和内核
scikit-learn 数据集加载工具
温馨提示
下载编程狮App,免费阅读超1000+编程语言教程
取消
确定
目录

scikit-learn 用户指南

scikit-learn 5.可视化

scikit-learn 7.数据集加载实用程序

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }