
目的
通過Kaggle的HR數(shù)據(jù)集分析身邊的小伙伴們?yōu)槭裁匆x職,并基于數(shù)據(jù)集中的特征制定一個評分卡模型來預(yù)測會不會離職。
數(shù)據(jù)集解釋
總覽:該HR數(shù)據(jù)集收集了15000份數(shù)據(jù),其中3571人離職,離職率23.8%。
satisfaction_level :對公司的滿意程度
last_evaluation :對公司的評價
number_project :做過項目的數(shù)量
average_montly_hours :每月工作時長
time_spend_company :每天在公司的時間
Work_accident :工作差錯
promotion_last_5years :五年內(nèi)有沒有提升
sales :職業(yè)
salary :薪資
left :是否離職
單變量分析
1. 工作差錯
零差錯員工離職率高于有差錯員工;
職場上大部分人(85.54%)沒有發(fā)生過工作差錯。從側(cè)面可以推斷,零差錯員工相對工作能力強(qiáng),因此這部分人遇到能力與薪資不匹配的境遇更多,導(dǎo)致跳槽幾率升高。
2. 每月有效工作時長
工作時長介于163~200 h/month 的員工離職率低。以每月22個工作日計算,每日上班時長在7.4~9.1小時的員工離職率相對較低(不知道那些“996”的老板們是否看過這個數(shù)據(jù))。因此,工作時間過長或過短,都有可能造成員工離職。
3. 離職前對公司的評價
對公司評價中上(0.6-0.78)員工的離職率遠(yuǎn)遠(yuǎn)低于對公司評價很高或很低的員工。那些對公司評價很高卻又離職的人,對公司的評價或許有言不由衷的成分吧,畢竟說自己老東家壞話的員工在哪里都不受歡迎。
4. 參與項目數(shù)量
參與項目數(shù)量為3到4個項目的人離職意愿非常低;
只參與2個項目及以下的員工則相對非常想離職。這也很好理解,到現(xiàn)在才做過兩個項目,要么是受排擠,要么是能力不被認(rèn)可,還是跳槽迎接新挑戰(zhàn)吧;
參與5個及以上項目的人也想離職意向也偏高。或許是因為做過這么多項目了,應(yīng)該是老員工,很多企業(yè)中,老員工能力增長的比薪資快很多,此處不留爺,自有留爺處!
5. 五年內(nèi)有沒有提升
結(jié)果情理之中,意料之內(nèi),五年都沒提升,肯定想離職啊!
6. 對公司的滿意程度
先說一個非常智障的結(jié)果,對公司評價滿分的1362個人中,無一人離職。對公司評價接近于零分的人中,離職率很高;
對公司評價中上(0.5-0.72)的員工離職率很低;
對公司評價很高的員工離職率也不低。我認(rèn)為有兩點原因,第一,這些人有些事真認(rèn)為公司很好,他們是被迫離職,不是主動離職;第二,這部分人有些人十分隱忍謹(jǐn)慎,雖然對公司不滿,雖然是匿名填寫,他們還是不敢吐露真言。
7. 每天在公司的時間
每天只在公司待兩個小時的不愿意離職,這部分人要么是高管,要么是尸位素餐,所以不愿意離職;
在公司待五個小時的員工離職率很高,這部分人應(yīng)該是銷售員或者是體力勞動者,他們在公司需要工作五小時,在外面可能還要工作5小時。
8. 薪資
這樣的結(jié)論真的是太不意外了,工資低當(dāng)然想跳槽了。
9. 職業(yè)
令人很意外的是,HR這個職業(yè)離職率高于其他職業(yè),可能是,哪個公司都需要HR吧;
management的離職率則相對偏低,可能是因為這部分人已經(jīng)在某一領(lǐng)域具備了一定專業(yè)水平和業(yè)務(wù)能力,因而在公司發(fā)展空間相對可預(yù)見。
決策樹
對離職率影響最大的因素是員工對公司的評價和每天在公司的時間。
評分卡模型
用邏輯回歸對各個特征的woe值進(jìn)行逐步回歸可得到評分卡模型(建模代碼太長,不一一貼出了)
注:得分越低,離職概率越大
總結(jié)
對離職率影響最大的因素是員工對公司的評價和每天在公司的時間;
HR可根據(jù)評分卡為公司職員做一次問卷調(diào)查,最后通過計算評分知曉各職員的離職意愿;
雖然很難改變員工對公司的評價,但是CEO可酌情給員工更多的辦公自由來減少離職率。