衛福部癌症資料庫開放專案

最後編輯:2017-07-03 建立:2017-07-01 歷史紀錄

 

    KIRBY W緣起

 

KIRBY W想要了解全台各鄉鎮罹癌的狀況與分佈, 不過政府資料並不容易使用 (cris.hpa.gov.tw 以5~7個步驟才能索取單個鄉鎮的歷年資料), 萌生了爬取所有資料的念頭. 日前已有其他的嘗試, 例如 http://github.com/hcchien/doh-cancer 使用 phantomjs 爬取, http://github.com/g0v/cancer/ 存有全民健保癌症相關統計資料, (其中就診人數值得深入探討)

 

5/10 CCSP Hackathon team goog1er (from g0v) 決定來把資料爬到 github 上順便視覺化, 因此此專案便加速進行了.

YUAN CCrawler repo: https://github.com/yhsiang/cris-cancer

 

資料欄位說明

分率=某特定癌症數÷總癌症數×100

粗率=(某特定癌症新診斷或死亡人數÷總人口數)×100000

年齡別率=(某年齡層癌症新診斷或死亡人數÷某年齡層人口數)×100000

標準化率=Σ(某特定年齡別率×該年齡層標準人口數)÷Σ(某特定年齡層標準人口數)×100000

 

資料抓取參數

[資料類型] 指標-發生率

[統計值] 年齡別率

[性別] 男性及女性

[年齡] 全部

[鄉鎮] 各鄉鎮區

[癌症部位] 全部

 

KIRBY W視覺化網址

 

http://g0v.github.io/cancer/viz/

 

    KIRBY W問題回報

KIRBY W資料及視覺化等若有問題或建議請留在這邊

    明哲 楊
  • MUYUEH L「癌症地圖」的癌症定義為何?是就診?死亡?
    Kirby Wu是罹患人數, 資料來源為 http://cris.hpa.gov.tw 他同時有提供粗率跟年齡化標準率, 不過我們還沒有使用, 只有單純自行計算粗率 (個案數除以鄉鎮總人數, 粗率那個 checkbox)
    Yuan Hsiang Cheng我們抓的是發生率,也就是新診斷出罹患癌症的,另外有一個死亡率才是統計因癌症死亡的資料
  • KIRBY W(bug) 高雄市三民區應分為那瑪夏區及三民區
    Kirby Wu已修正
  • (bug) 資料錯誤, 有些鄉鎮變成很多鄉鎮的總和
    • Yuan Hsiang Chengcrawler程式有問題,已修正
  • (bug) 臺南市關廟區沒有資料
    Yuan Hsiang Cheng已向國民健康署反應
  • (suggest) 鄉鎮區塊可以改為點擊時顯示資料
    Kirby Wu已改進
  • (question) 資料可以拿去用嗎?
  • AUDREY T(suggest) 好像應該先把全部資料的大小值都拿到後再來決定 scale,這樣比較看得出來上升情形(我做看看
    Audrey Tang看起來效果好像沒比較好,應該要分病別,但是設定 scale 爲歷年最低到最高
    Audrey Tangg0v/cancer#3
    Audrey Tang改在這,@kirby 可以看一下\\
    Kirby Wu順便做成一個可開關的選項了
  • RYO P(suggest) 單從人數看幾乎都集中在北高了,建議再加入城市人口數,可形成人數比例值(癌數/城鎮人口),從比例值著色的話色塊應該會有所改變。另一參考值為醫院數,可看出醫療分布均度(癌數/中小型醫院以上數量)。希望這兩個分母作為可選。