[社群] Data science meetup – 電信大數據 & 量子機器學習

點閱: 137

今天來參與data science meetup舉辦的講座,邀請到中華電信研究院的官俊安與書亞集成的曾義豐,分享電信業的大數據工作與量子電腦的機器學習,以下是今天的大綱

Agenda:
6:40-7:00 Check in
7:00-7:40 官俊安 @ 中華電信
7:40-8:20 曾義峰 @ 書亞集成
8:20-8:30 Break
8:30-9:00 Panel

官俊安: 電信大數據之分析實務

  • 主修統計
  • 資料:手機、wifi、通信、MOD
  • 足跡 = 商品購買的先行信號(AISAS)
    • Attention
    • Invest
    • Search
    • Action
    • Share
  • 客戶的數位化象包含下列資料:人口屬性、內容偏好、消費模式、廣告取向、行為模式、商品偏好
應用情境
  • 商圈規劃&活動經營()
  • 展店選址
  • 交通&旅遊分析
  • 客戶經營
  • 客戶開發

案例: 2019年屏東燈會人數估算

應用類型
  • 精準行銷(最大宗,也是今天的主題)
  • 精準建設
  • 品質分析
  • 人資/採購
電信業的生命週期: 新客戶 -> 經營 -> 鞏固 -> 贏回流失客戶

重點是鞏固與贏回流失客戶

  • 描述型分析

    發生了什麼

  • 診斷型分析

    為什麼發生

  • 預測型分析(客戶流失預測模型)

    未來會不會發生

  • 指示型分析(客戶挽留預測模型)

    如何讓它發生

事前模型 -> 事中分析 -> 事後模型優化

  • 事前模型

  • 事中分析

    輿情分析

  • 事後模型優化

流失預測模型的思考與設計
  • 需要分群建模嗎?
    • 分層抽樣 vs 簡單隨機抽樣(以路克106年消費額預測為例,分藍綠執政縣市vs簡單隨機抽樣的抽樣方法,效果就會不一樣)
  • 資料品質?

預測變數的發展作法

  • 經驗法則
  • 因果關係推論
  • 統計方法,探討x與y的關係

演算法的實務作法

  • 黑貓白貓,解釋力高的就是好貓
    • 預測力
    • 解釋力
    • 效率

流失預測模型的效果衡量作法

  • Y具有稀少事件的特性
  • 不看accurancy
  • 混淆矩陣
  • 重視precision rate, recall rate, lift value

如何擴大訊源(增加資料來源)

  • 藉由’少量受話、大量發話’的特性,比對whos call的電話,找出同業的行銷電話,再反推出被同業行銷電話打過的客戶,來增加資料量,增進流失模型的預測
  • SNA(Social Network)的影響(類似出軌後的假後道相報)
  • 納入寬頻上網,得到更多的數位足跡,擴充資料量

重要事件的組合

  • 打電話去中華電信問NP流程 -> 詢問NP的費用說明 -> 收到同業的推銷訊息 ==> 非常容易客戶流失

老闆總愛問能不能更準

  • IEEE: lift達3.5倍已很不錯,中華電信已約10倍
  • Verizon主管:lift約5倍
  • 邊際效益

曾義峰 @ 書亞集成

量子電腦的基本原理
雙縫實驗(double slit experiment): 擊發單獨電子通過雙縫時,在途中會發現通過雙縫後在某個距離中,可以觀察到電子變成多個,但是最後又是只有一個,這個就像是幽靈般的存在(波爾),但是愛因斯坦說胡扯。

硬幣翻轉
人與電腦比賽猜硬幣的正反面,雙方的勝率大約都是50%,但如果是與量子電腦比賽,電腦的勝率會是95%以上

About the Author

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Related Posts