Hits: 271
今天來參與data science meetup舉辦的講座,邀請到中華電信研究院的官俊安與書亞集成的曾義豐,分享電信業的大數據工作與量子電腦的機器學習,以下是今天的大綱
Agenda:
6:40-7:00 Check in
7:00-7:40 官俊安 @ 中華電信
7:40-8:20 曾義峰 @ 書亞集成
8:20-8:30 Break
8:30-9:00 Panel
官俊安: 電信大數據之分析實務
- 主修統計
- 資料:手機、wifi、通信、MOD
- 足跡 = 商品購買的先行信號(AISAS)
- Attention
- Invest
- Search
- Action
- Share
- 客戶的數位化象包含下列資料:人口屬性、內容偏好、消費模式、廣告取向、行為模式、商品偏好
應用情境
- 商圈規劃&活動經營()
- 展店選址
- 交通&旅遊分析
- 客戶經營
- 客戶開發
應用類型
- 精準行銷(最大宗,也是今天的主題)
- 精準建設
- 品質分析
- 人資/採購
電信業的生命週期: 新客戶 -> 經營 -> 鞏固 -> 贏回流失客戶
重點是鞏固與贏回流失客戶
-
描述型分析
發生了什麼
-
診斷型分析
為什麼發生
-
預測型分析(客戶流失預測模型)
未來會不會發生
-
指示型分析(客戶挽留預測模型)
如何讓它發生
事前模型 -> 事中分析 -> 事後模型優化
-
事前模型
-
事中分析
輿情分析
-
事後模型優化
流失預測模型的思考與設計
- 需要分群建模嗎?
- 分層抽樣 vs 簡單隨機抽樣(以路克106年消費額預測為例,分藍綠執政縣市vs簡單隨機抽樣的抽樣方法,效果就會不一樣)
- 資料品質?
預測變數的發展作法
- 經驗法則
- 因果關係推論
- 統計方法,探討x與y的關係
演算法的實務作法
- 黑貓白貓,解釋力高的就是好貓
- 預測力
- 解釋力
- 效率
流失預測模型的效果衡量作法
- Y具有稀少事件的特性
- 不看accurancy
- 混淆矩陣
- 重視precision rate, recall rate, lift value
如何擴大訊源(增加資料來源)
- 藉由’少量受話、大量發話’的特性,比對whos call的電話,找出同業的行銷電話,再反推出被同業行銷電話打過的客戶,來增加資料量,增進流失模型的預測
- SNA(Social Network)的影響(類似出軌後的
假後道相報
) - 納入寬頻上網,得到更多的數位足跡,擴充資料量
重要事件的組合
- 打電話去中華電信問NP流程 -> 詢問NP的費用說明 -> 收到同業的推銷訊息 ==> 非常容易客戶流失
老闆總愛問能不能更準
- IEEE: lift達3.5倍已很不錯,中華電信已約10倍
- Verizon主管:lift約5倍
- 邊際效益
曾義峰 @ 書亞集成
量子電腦的基本原理
雙縫實驗(double slit experiment): 擊發單獨電子通過雙縫時,在途中會發現通過雙縫後在某個距離中,可以觀察到電子變成多個,但是最後又是只有一個,這個就像是幽靈般的存在(波爾),但是愛因斯坦說胡扯。
硬幣翻轉
人與電腦比賽猜硬幣的正反面,雙方的勝率大約都是50%,但如果是與量子電腦比賽,電腦的勝率會是95%以上
Comments