第4章 第1節 數據分析

推薦給朋友

● 請說一下,你曾經處理過的最大量級數據是多少?處理目的是?你是如何處理的?處理結果如何?

參考回答:

● 下表為某款APP在17年Q2的日均新增用戶的渠道數據: 1)根據上表,你能得出哪些結論? 2)17年4月,Android端的渠道A單個新增用戶成本為3元,渠道B單個新增用戶成本為10元。這批新增用戶? 的留存率分別為15%(渠道A)和50%(渠道B),付費率分別為5%(渠道A)和20%(渠道B)。那么渠道A??? 和渠道B的單個留存用戶成本和單個付費用戶成本分別是多少?假設每個用戶付費額一樣,哪個渠道的投入產出比更高?(請給出計算過程)"

參考回答:

1)
該款APP在Q2日均新增用戶整體呈平穩上升趨勢。
Q2安卓總體月均新增用戶高于IOS。其中安卓Q2每月新增用戶呈下降趨勢,IOSQ2每月新增用戶呈上升趨勢。IOS新增用戶來源渠道中,以APPStore為主;安卓新增用戶來源渠道中,以A預裝渠道和B市場渠道為主。
2)付費率的分母是全部新增用戶,還是留存的用戶數。我這里就把付費率的分母理解為全部新增用戶數。
A:
單個用戶留存成本:3/15%=20元
單個付費用戶成本:3/5%=60元
B:
單個用戶留存成本:10/50%=20元
單個付費用戶成本:10/20%=50元
A:
ROI=3/(5%n)=60/n
B:
ROI=10/(20%n)=50/n
A的投入產出比高。

● "如果一款游戲在蘋果上線,每個用戶每月會花50元,這些人第二個月會留下40%,第三個月會留下20%,他們帶來的所有的收入,蘋果會拿走30%。 我們最多花多少錢得到一個用戶,才能賺錢?假設我們可以用30元獲得一個用戶,如果我們希望在這個游戲上賺100萬利潤,我們需要多少用戶?需要付出多少廣告費?"

參考回答:

● 試估算中國K12課外英語輔導的市場(K12:kindergarten through twelfth grade的簡寫,是指從幼兒園(Kindergarten,通常5-6歲)到十二年級(grade12,通常17-18歲),在中國等同于小學到高中畢業階段)。 要求如下: ·請至少使用2種不同的方案來估算,以便能夠交叉驗證。 ·請詳細說明需要獲取哪些數據,以及如何獲取,并且給出相應數據的估算值。 ·請詳細描述如何通過獲取到的數據來估算題目的答案,并給出最終的估算值。

參考回答:

方法一:需求端分析
分析問題:
中國K12課外英語輔導的市場,現在中國的學校、家長和學生對于英語學習都很重視,英語輔導是一個強需求,目前學生數量、參培率和收費價格都在提高,從需求端,需要知道中國處于K12的總人數、參與英語培訓的人數、英語培訓年均花費等。

假定2018年中國K12課外英語輔導的數據如下:
在校中小學生總計2.24億人(中國14億人口,中國人均壽命75歲,假設人口按照歲數均勻分布,高中入學率為90%,于K12階段人群數量=14億*(9+3*90%)/75=2.184億);
參與課外培訓率為60%(依據常識,參與培訓學生);
參與課外培訓學生中參與英語輔導率為60%;
英語輔導年均培訓費用2000元/人;
據此估算:市場規模:2.184億*60%*60%*2000=1572.48億元。

方法二:供給端分析
假定數據如下:
K12教育培訓機構中轉職英語老師與公立學校英語老師比例為6:4.
全國中小學老師數量:K12前6年師生比為1:20,K12后6年師生比為1:10,那么老師數量=14億*(6個年級/75歲)*(1/20)+14億*(3個年級/75歲)*(1/10)+14億*(3個年級/75歲*90%)*(1/10)=1633.33萬(人)

英語老師占比15%,數量=1633.33萬*15%=245萬(人)
公立學校參與英語輔導的老師的占比15%,數量=245萬*15%=36.75萬(人)
那么K12教育英語老師總數量為36.75萬/40%=91.875萬
假定每個老師每年輔導100人次,參與英語培訓的學生為91.875萬*100=9187.5萬人次
每位學生每年英語輔導費用2000元
據此估算:市場規模:9871.5萬人*2000元/人=1837.5億元。

● 以下是某校園公眾號8.14-9.12的推送消息打開數,請分析: (1)圖中一個月內的數據趨勢及其可能的原因 (2)作為產品經理,如何幫助該公眾號提高打開率

參考回答:

答案(1):
以7天為一個周期,8.14-9.12歷時4周
① 周期內數據趨勢及分析:
·每個周期的第四天打開數相對偏低。
可能原因:每周的這一天,用戶對該校園公眾號不敏感,或者同學的學習生活較忙。
·每個周期的第五天打開數相對前一天,增長較大。
可能原因:每周的這一天,用戶對該校園公眾號較敏感,或某些周期性事情誘導他們打開。
·每個周期會有兩個消息打開數的峰值。
可能原因:學生生活學習具有周期性規律,會影響到公眾號的打開。另外,也可能跟公眾號定期發布的內容有一定關系。

② 周期間數據趨勢及分析:
·第一個周期后,打開數逐步提升
可能原因:由圖可得8月21號后,打開率明顯提升,推測主要原因為:開學了;
·后面三個周期,打開數穩定在50000左右
可能原因:50000可視為該公眾號這一段時間內打開數的穩定值,在沒有額外推廣運營的情況下,可認為該值趨于一個穩定狀態。


答案(2):
幫助該公眾號提高打開率的方法
① 影響該公眾號打開率的主要因素有:
?文章選題,選題是否是學生關心的,當下的熱點(學校/社會)。
?文章標題,標題質量很大程度上決定了文章的打開與否。
?文章內容,內容質量和排版會影響到文章的分享情況。
?內容調性,塑造具有識別性的內容調性有助于培養忠實粉絲。
?運營手段,運用活動等手段可以更好的促進傳播。

② 提高提高打開率的方法
?文章選題,生產與校園熱點話題相關的內容,例如畢業季,新生開學,四六級等等。
?文章標題,提高標題撰寫能力,使用具有吸引力的標題,但盡量不要標題黨。
?文章內容,保證高質量的內容輸出,可以組織專業寫手撰寫內容,還可以增加互動內容,刺激用戶分享。排版上,要注意排版風格是受眾喜歡的。
?內容調性,塑造公眾號的價值觀和調性,拉近與受眾之間的距離,培養忠實粉絲。
?運營手段,適當組織一些線上線下活動,例如聯合校園周邊商家贈送優惠券等等,促進文章打開和用戶活躍。

● 一個女鞋品牌在某電商平臺銷售,你認為通過哪些數據和方法可以看出銷售現狀和業務提升。

參考回答:

可以從數據來進行橫向對比和縱向對比,并與其它競爭品牌對比:

1. 橫向對比:
對比該品牌在不同平臺上的月銷售量、銷售的型號款式、銷售額等指標。了解品牌在不同平臺的銷售狀況,以確定針對該平臺應采取的營銷策略。

2. 縱向對比:
對比該品牌在該平臺上的月銷售量、銷售的型號款式、銷售額等指標隨時間的變化,同比和環比增長情況,確定屬于增長、下降、平穩還是停滯狀態。確定品牌在該平臺的銷售現狀。

3. 與競爭品牌對比
對比在該平臺上競爭品牌的銷售情況,包括月銷售量、銷售的型號款式、銷售額等指標,以確定整體市場的變化趨勢。

● 電影放映時,電影院里很黑,你有什么辦法知道這個放映廳里用Android手機的人多,還是用iOS手機的人多?

參考回答:

1. ?根據電影院的價位與檔次判斷:
假設:使用iOS手機的用戶消費水平較高
電影院中高檔價位時,使用iOS手機用戶多。

2. 根據電影院所在地理位置及周邊配套設施判斷:
假設:使用iOS手機的用戶收入及消費水平較高
電影院處在中高檔商場周邊時,使用iOS手機用戶多;
電影院處在CBD附近時,使用iOS手機用戶多。

3. 根據電影面向的觀影群體判斷
假設:觀影群體的年齡與消費水平掛鉤,消費水平高使用iOS手機用戶多;男性用戶使用安卓手機多
觀影群體低齡化,使用安卓手機的用戶多;
電影男性向重,使用安卓手機用戶多。

● 如何推算在一個城市的共享單車投放量和每日交易數量?

參考回答:

如何推算在一個城市的共享單車投放量和每日交易數量?

共享單車投放量:
該城市總人數X能夠騎自行車的人數X無自行車人數比例/每輛車每天可服務的用戶數
假設:
城市總人數為2400萬
能夠騎自行車的人數:18-60歲年齡人群 2400萬X42/80=1260萬人
無自行車人數比例:5/6
每輛車每天可服務用戶數:假設使用車的人每天使用兩次,每輛車每天可使用時長X使用率/用戶單次使用時長=12hX1/3 /0.2h=20, 則服務的人為10人
故:總投放量=1260X5/6/10=100萬

交易數量:
共享單車投放量X每輛車每天被使用次數
=共享單車投放量X每輛車每天可使用時長X使用率/用戶單次使用時長
故:
交易總量=100萬X12hX1/3 /0.2h=2000萬

● 有一項數據分析任務交給你分析,分析完成后發現你得出的結論與上級得出的結論不一致。上級讓你按照其要求總結報告,請問你會怎樣做?

參考回答:

1. 重新檢查數據結論,確認正誤
如果確認自己的結論正確,則

2. 思考上級得出結論的出發點和漏洞
思考上級得出結論是基于什么假設,有什么漏洞

3. 從上級的角度出發,簡明扼要地向對方解釋結論的正確性,說服對方
拿出充分的數據證明,并向上級解釋清楚,以理服人。

● 以下是某App的日活數據,該App主要用戶群是三四線城市男性用戶,如果你是這家公司的產品人員 a、從數據中,你看到了什么問題?你覺得背后的原因是什么? B、如果你的老板要求你提出一個改進計劃,你會怎么做? 數據如下: 8月10日(周一):47361 8月11日(周二):53424 8月12日(周三):56876 8月13日(周四):52012 8月14日(周五):49833 8月15日(周六):30125 8月16日(周日):29938

參考回答:

● 請你估算一下,在春節前倒數第三天,首都國際機場一天的人流量。

參考回答:

此類估算問題一般都可從供需兩個角度來思考,一般情況下供需會匹配。
但“春節倒數前三天”這個時刻一定是需求大于供應,因此從供應的角度來思考比較合理。

總人流量包括:飛機乘客,送機人員,其它工作人員。此處只考慮大頭:乘機人員。
從供應思考當天機場能夠提供多少乘客的運輸:
乘客吞吐量
=機場當天起降的飛機數量X每架飛機實際乘客數
=機場跑道數量X機場跑道開放時長/每架飛機起降需要花費的平均時長X每架飛機可承載人數X上座率
假設:
跑道:5個
每架飛機起降需要花費的平均時長:3min
機場跑道開放時長:6:00-2:00(隔天)共計20h
每架飛機可承載人數:飛機一般有三種大小,但中型大型居多,假設分別占比8:2,可承載人數200:400
上座率:由于是春節,假設飛機平均上座率為90%
則:5X20h/3minX(0.8X200+0.2X400)X0.9
=36
大約36萬人。

● 請你提供一個可行的解決思路,估算一下上海有多少輛自行車。

參考回答:

  • 上海市的自行車數量=私人自行車數量+共享單車數量
  • 私人自行車數量=該城市總人數X能夠騎自行車的人數X有自行車人數比例
  • 共享單車數量=該城市總人數X能夠騎自行車的人數X無自行車人數比例/每輛車每天可服務的用戶數
其中:
  • 共享單車投放量:
該城市總人數X能夠騎自行車的人數X無自行車人數比例/每輛車每天可服務的用戶數
假設:
  • 城市總人數為2400萬
  • 能夠騎自行車的人數:18-60歲年齡人群 2400萬X42/80=1260萬人
  • 無自行車人數比例:5/6
  • 每輛車每天可服務用戶數:假設使用車的人每天使用兩次,每輛車每天可使用時長X使用率/用戶單次使用時長=12hX1/3 /0.2h=20, 則服務的人為10人
故:總投放量=1260X5/6/10=100萬
  • 私人自行車數量
該城市總人數X能夠騎自行車的人數X有自行車人數比例
假設:
  • 城市總人數為2400萬
  • 能夠騎自行車的人數:18-60歲年齡人群 2400萬X42/80=1260萬人
  • 有自行車人數比例:1/6
故:私人自行車數量=1260X1/6=200萬

  • 總自行車數量
故總自行車數量=200萬+100萬=300萬

● 分析數據的時候發現,其他交易額都增長了,只有男裝行業較去年同期下降了20%,你認為可能是什么原因?說明一下你的分析思路過程。

參考回答:

核心:交易額=銷量X單價

1. 對比銷量與去年同期變化
  • 若銷量不變或提升,說明有降價操作;
  • 若銷量減少,則:

2. 對比單價與去年同期變化
  • 若單價提升,說明價格提升對用戶而言接受度低;
  • 若單價不變或降低,則考慮是否有外部因素導致銷量減少,
比如:
  • 是否有重大活動?比如世界杯奧運會等大型賽事?
  • 是否有相關國家政策?

● 你認為如何通過大數據優化電梯廣告內容?

參考回答:

通過大數據獲取:

1. 使用電梯的用戶畫像
包括:年齡、職業、性別、大致收入及消費水平等

2. 電梯的應用場景
是公寓?商場?寫字樓?不同的場景下采取不同的廣告投放策略

根據不同的用戶畫像和電梯所處的應用場景,有針對性的投放廣告。?

● 酒店入住是一個季節性比較強的生活需求,人們旅游、商務都需要入住酒店。房間的需求量在時序上存在規律,但又有很多突發型的小高峰和低谷。現實中,大約有60%的人入住酒店會提前n天(假設1<=n<=30)預定。請設計一套預測某個城市未來某一天酒店入住房間數的系統: 1)如何收集數據,并給出采集的日志(或數據)結構 2)預測(求解)入住需求量 3)闡述預測系統帶來的現實意義

參考回答:

● 請你估算一下,廣州市的出租車數量。

參考回答:

可以從供需兩個角度來考慮:
1. ?供給:
廣州市小轎車總數X出租車比例
=廣州市人口數X人均小轎車保有量X出租車比例
??
2. ?需求:
廣州市人口數X可打車的適齡人數X打車比率X平均每天打車的次數/每輛車每天服務的人數
假設:
  • 廣州人口:2000萬人
  • 可打車適齡人數:12-60歲,2000萬X48/80約1000萬
  • 打車比例:有1/5的人有打車需求
  • 平均每天打車次數:平均每五天打車一次,則每天1/5次
  • 每輛車每天服務人數:每天工作時長X非空車時長占比/單次載客時長=12hX1/3/0.25h=16
故:
1000萬X1/5X1/5/16=2.5萬

● 請你估算一下,你所在的城市三星級及以上的酒店大概有多少。

參考回答:

此類估算問題一般都可從供需兩個角度來思考,一般情況下供需會匹配。?
但酒店數通常供應>需求,因此可以從供應的角度來考慮比較簡單。

該城市三星級及以上酒店數目
=該城市所有酒店數目X三星及以上酒店數目占比
=該城市居住面積/每個酒店的輻射范圍X三星及以上酒店數目占比
假設:
上海居住面積為6000平方公里
每個酒店輻射范圍為1X0.5=0.5平方公里
三星及以上酒店占比為20%
則:
6000/0.5X0.2=2400
故上海有三星及以上酒店2400家。

● 如果讓你估算成都市理發店的總量,你有多少種方法可以估算?

參考回答:

方法:
  1. 直接在大眾點評上搜索
  2. 在百度地圖上搜索
  3. 查詢工商局注冊的理發店數目
  4. 自己估算
  • 從供給角度估算
理發店數量
=城市居住面積/單位面積理發店數量
  • 從需求角度估算
理發店數量
=每天需要理發的人數/平均每家店單日可接待人數
=城市人口數X需要理發的用戶比例X理發頻率/平均每家店單日可接待人數??

● 請你簡述一下數據運營的定義,并闡述一下常用的數據分析方法及適合的應用場景。

參考回答:

1)數據運營:通過數據挖掘、分析來判斷分析運營效果、指導運營活動。

2)常見的數據分析方法如下:
1.?杜邦分析法
使用金字塔來層次拆分問題,比如銷售額=客單*訪客*轉化,然后訪客又可以細分到瀏覽量、停留、流失等,瀏覽量又可以拆分成不同渠道的瀏覽量。
適用場景
  • 電商銷售額
  • 會員收入
2.?漏斗分析法
通過漏斗來逐層分析流失及轉化情況,如潛在用戶——接觸用戶——停留用戶——行為用戶——有效用戶——成交用戶——二次成交用戶——核心用戶——自傳播用戶。
使用場景
  • 用戶增長
  • 用戶轉化
3.?矩陣/四象限分析法
比如按照SWOT 來分析,或者按照其它可拆解的維度和象限來分析,比如市場占有率、產品成交量等。
使用場景:
  • 競品分析
  • 業務對比

● 請你估算一下武漢市共有多少個加油站。

參考回答:

可以從供應和需求兩個角度來分析

1. 供應角度
加油站數目=武漢市面積/單位面積加油站的數目
=武漢市面積/每個加油站覆蓋的服務面積
假設
  • 面積為8000平方公里
  • 每個加油站服務的面積為:2X2=4平方公里
則:
加油站數=8000/4=2000個

2. 需求角度
加油站數目=武漢市每天需要加油的車的數量/每個加油站每天可服務的人數
=武漢市機動車輛總數/每輛車每天加油的概率/每個加油站每天可服務的人數
=武漢市(私家車數目+非私家車數目)/每輛車每天加油的概率/每個加油站每天可服務的人數

其中:
武漢市私家車數目=武漢市家庭數X有車家庭的比例
=武漢市人口數/3X有車家庭的比例

假設:
  • 武漢市私家車:非私家車數目=2:8
  • 武漢市人口數:1000萬
  • 有車一族比例為1/5
則私家車數目=1000/3/5=60萬
車輛總數為300萬
  • 每輛車每周加油1次,則每天加油概率為1/7
  • 每個加油站工作時長24h,有3個工作人員,其中白天12個小時內,每10分鐘服務一個用戶,晚上每小時服務一個用戶。
  • 則每個加油站每天可服務的人數=12X3X(6+1)=250
則加油站數目
=武漢市機動車輛總數/每輛車每天加油的概率/每個加油站每天可服務的人數
=300萬/7/250
=2000

● 請你預測一下,在星期五下午兩點半有多少用戶在刷朋友圈。

參考回答:

分析思路:
星期五:工作日
下午兩點半:工作時間

此時刷朋友圈人數
=微信日活X有刷朋友圈習慣的用戶比例X該時刻刷朋友圈的用戶比例
假設:
微信日活:10億
刷朋友圈習慣的用戶比例:90%
刷朋友圈的時長在一天內的變化會有幾個高峰,其它時刻均勻分布,工作時間非高峰,假設非高峰期刷朋友圈的概率為1%
則:
此時刷朋友圈人數=10億X90%X1%=900萬

● 請你估算一下,中國所有航班一天承運的客流量。

參考回答:

中國所有航班一天承運的客流量
=中國所有機場一天的客流量

從供應思考當天機場能夠提供多少乘客的運輸:
乘客客流量
=機場數目X機場當天起降的飛機數量X每架飛機實際乘客數
=機場數目X機場跑道數量X機場跑道開放時長/每架飛機起降需要花費的平均時長X每架飛機可承載人數X上座率

假設:
  • 機場數目:150個
  • 跑道:3個
  • 每架飛機起降需要花費的平均時長:5min
  • 機場跑道開放時長:6:00-2:00(隔天)共計20h
  • 每架飛機可承載人數:飛機一般有三種大小,但中型大型居多,假設分別占比8:2,可承載人數200:400
  • 上座率:假設飛機平均上座率為60%
則:150X3X20h/5minX(0.8X200+0.2X400)X0.6
=1200萬

● 如何測算分享路徑所帶來的新用戶數?

參考回答:

在設置分享路徑時,采用以下標記策略:

1. 在分享鏈接上加上特殊標記
如果是通過鏈接、H5等分享,可以在鏈接上加入特殊標記

2. 通過用戶直接分享的,可以加上推薦優惠碼等特殊口令
新用戶可以在進入時使用好友的推薦碼

3. 設置多重分享路徑
包括H5、二維碼、推薦碼等,區分不同渠道帶來的新用戶

● 北京中關村公司樓下有一面館,70平米,收銀員2位,每天提供早餐、中餐、晚餐。如果你來做估算,計算每天的營業額是多少?如何評估盈利情況?

參考回答:

● 請你估算一下,今年全國通過網絡參加4-12歲少兒英語在線培訓的人數?

參考回答:

從需求的角度來分析:

全國通過網絡參加4-12歲少兒英語在線培訓的人數
=全國4-12歲少兒數X參加英語培訓人數比例X線上培訓比例
=全國人數X4-12歲人口比例X參加英語培訓人數比例X線上培訓比例
假設:
  • 全國人口14億人
  • 4-12歲人口占比8/80=10%
  • 參加英語培訓人數比例:5%
  • 線上培訓比例:10%
則:
14億X10%X5%X10%
=70萬

● 請解讀以下數據表格,輸出你對該款產品的觀察與分析。(見下圖)

參考回答:

● 請說出以你住的地方為中心,半徑3公里內最大的超市是哪一家? 然后,請用有效方法計算出這個超市在,9月15日,星期六,晚23:59,貨架上還有多少瓶330毫升的紅色聽裝可口可樂

參考回答:

● 上海有多少輛自行車?請提供一個可行的解決該問題的思路

參考回答:

  • 上海市的自行車數量=私人自行車數量+共享單車數量
  • 私人自行車數量=該城市總人數X能夠騎自行車的人數X有自行車人數比例
  • 共享單車數量=該城市總人數X能夠騎自行車的人數X無自行車人數比例/每輛車每天可服務的用戶數
其中:
  • 共享單車投放量:
該城市總人數X能夠騎自行車的人數X無自行車人數比例/每輛車每天可服務的用戶數
假設:
  • 城市總人數為2400萬
  • 能夠騎自行車的人數:18-60歲年齡人群 2400萬X42/80=1260萬人
  • 無自行車人數比例:5/6
  • 每輛車每天可服務用戶數:假設使用車的人每天使用兩次,每輛車每天可使用時長X使用率/用戶單次使用時長=12hX1/3 /0.2h=20, 則服務的人為10人
故:總投放量=1260X5/6/10=100萬
  • 私人自行車數量
該城市總人數X能夠騎自行車的人數X有自行車人數比例
假設:
  • 城市總人數為2400萬
  • 能夠騎自行車的人數:18-60歲年齡人群 2400萬X42/80=1260萬人
  • 有自行車人數比例:1/6
故:私人自行車數量=1260X1/6=200萬

  • 總自行車數量
故總自行車數量=200萬+100萬=300萬
久热热在线视频精品店4