發(fā)文章
發(fā)文工具
撰寫
網(wǎng)文摘手
文檔
視頻
思維導(dǎo)圖
隨筆
相冊(cè)
原創(chuàng)同步助手
其他工具
圖片轉(zhuǎn)文字
文件清理
AI助手
留言交流
樣本缺失問題
在數(shù)據(jù)處理時(shí),差不多1%控制變量數(shù)值缺失,這種要?jiǎng)h除缺失值嗎,還是直接不管呢。
回答:這個(gè)不太好明確說,給你幾種情況說明吧:如果1%的控制變量集中于少數(shù)樣本,那么可以去掉這些樣本;如果這些缺失值分布于不同的樣本,盡量選擇填補(bǔ)法去填補(bǔ)一下
來自: 新用戶68639482 > 《待分類》
0條評(píng)論
發(fā)表
請(qǐng)遵守用戶 評(píng)論公約
大數(shù)據(jù)的風(fēng)險(xiǎn)和現(xiàn)存問題
大數(shù)據(jù)的風(fēng)險(xiǎn)和現(xiàn)存問題?!皵?shù)據(jù)增值的關(guān)鍵在于整合,但自由整合的前提是數(shù)據(jù)的開放。開放數(shù)據(jù)是指將原始的數(shù)據(jù)及其相關(guān)元數(shù)據(jù)以可以下...
手把手帶你入門數(shù)據(jù)插補(bǔ)(附代碼)
手把手帶你入門數(shù)據(jù)插補(bǔ)(附代碼)本文將為你介紹數(shù)據(jù)缺失時(shí)的處理辦法。不可忽略的缺失(non-ignorable missing ,NIM)亦稱為非隨機(jī)缺失(not missing at random, NMAR),也有研究將其稱為MNAR(missing no...
面板PSM DID如何做匹配?
然而,二者在適用范圍方面并不相同,即 PSM 模型適用于截面數(shù)據(jù),而 DID 模型適用于面板數(shù)據(jù)。其中,(a) 和 (b) 屬于平衡面板數(shù)據(jù),并且...
聊聊如何清理數(shù)據(jù)|案例和步驟
使用箱線圖、散點(diǎn)圖或直方圖直觀地探索數(shù)據(jù)檢查數(shù)據(jù)是否呈正態(tài)分布為每個(gè)變量創(chuàng)建摘要(描述性)統(tǒng)計(jì)數(shù)據(jù)在頻率表中總結(jié)定量數(shù)據(jù)通過可...
中國(guó)工業(yè)企業(yè)數(shù)據(jù)庫(kù)的使用現(xiàn)狀和潛在問題(下)
在樣本選擇方面,工業(yè)企業(yè)數(shù)據(jù)庫(kù)的一個(gè)突出問題是,它包括了全部的國(guó)有工業(yè)企業(yè),但是只包括了規(guī)模以上的非國(guó)有工業(yè)企業(yè)。分析中國(guó)的企業(yè)不可能忽略企業(yè)的所有制。在1999-2007年工業(yè)企業(yè)數(shù)據(jù)庫(kù)中,在...
回歸中各變量的數(shù)值相差過大有事, 又有什么問題?
回歸中各變量的數(shù)值相差過大有事, 又有什么問題?所有計(jì)量經(jīng)濟(jì)圈方法論叢的code程序, 宏微觀數(shù)據(jù)庫(kù)和各種軟件都放在社群里.歡迎到計(jì)量經(jīng)...
解疑答惑 | 缺失值真的要被無情拋棄嗎?
解疑答惑 | 缺失值真的要被無情拋棄嗎?缺失值是一個(gè)在任何研究中都普遍存在的問題,相信大家在撰寫論文或者進(jìn)行數(shù)據(jù)分析的過程中,都會(huì)...
【1044.】松哥為啥我318樣本量統(tǒng)計(jì)分析出來確實(shí)400樣本量?
【1044.】松哥為啥我318樣本量統(tǒng)計(jì)分析出來確實(shí)400樣本量?可是分析結(jié)果顯示樣本量就是400。那句話就是“請(qǐng)注意,雖然你數(shù)據(jù)庫(kù)中確實(shí)是3...
非靶向代謝組學(xué)數(shù)據(jù)處理的基本流程
原始數(shù)據(jù)經(jīng)過數(shù)據(jù)預(yù)處理之后轉(zhuǎn)換成可供下一步數(shù)據(jù)分析的數(shù)據(jù)矩陣,通常在這個(gè)數(shù)據(jù)集中行數(shù)對(duì)應(yīng)樣本的個(gè)數(shù),列數(shù)對(duì)應(yīng)變量(代謝物信號(hào))...
微信掃碼,在手機(jī)上查看選中內(nèi)容