| Parameters: |
sort : boolean, default False
na_sentinel: int, default -1
|
|---|---|
| Returns: |
labels : the indexer to the original array uniques : the unique Index |
labels:對(duì)應(yīng)的編碼array
uniques:需要編碼的類(lèi)型
補(bǔ)充:pandas.get_dummies 的使用及含義
get_dummies參數(shù)如下:
pandas.get_dummies(data,prefix = None,prefix_sep ='_',dummy_na = False,columns = None,sparse = False,drop_first = False,dtype = None )
data : array-like,Series或DataFrame
prefix :string,字符串列表或字符串dict,默認(rèn)為None,
用于追加DataFrame列名的字符串。在DataFrame上調(diào)用get_dummies時(shí),傳遞一個(gè)長(zhǎng)度等于列數(shù)的列表。或者,前綴 可以是將列名稱(chēng)映射到前綴的字典。
prefix_sep : string,默認(rèn)為'_'
如果附加前綴,分隔符/分隔符要使用。或者傳遞與前綴一樣的列表或字典。
dummy_na : bool,默認(rèn)為False
如果忽略False NaN,則添加一列以指示NaN。
columns : 類(lèi)似列表,默認(rèn)為無(wú)
要編碼的DataFrame中的列名稱(chēng)。如果列是None,那么所有與列 對(duì)象或類(lèi)別 D型細(xì)胞將被轉(zhuǎn)換。
sparse : bool,默認(rèn)為False
偽編碼列是否應(yīng)由SparseArray(True)或常規(guī)NumPy數(shù)組(False)支持。
drop_first : bool,默認(rèn)為False
是否通過(guò)刪除第一級(jí)別從k分類(lèi)級(jí)別獲得k-1個(gè)假人。
版本0.18.0中的新功能。
dtype: D型,默認(rèn)np.uint8
新列的數(shù)據(jù)類(lèi)型。只允許一個(gè)dtype。
版本0.23.0中的新功能。

prefix自定義前綴

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
標(biāo)簽:通遼 潛江 呂梁 黑龍江 銅川 常德 阿里 株洲
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《pandas:get_dummies()與pd.factorize()的用法及區(qū)別說(shuō)明》,本文關(guān)鍵詞 pandas,get,dummies,與,pd.factorize,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。