中研院「社會變遷全記錄」半自動化計畫

最後編輯:2017-07-03 建立:2017-07-01 歷史紀錄

 

    IPA C專案簡介

 

ET B緣由

 

CHIA-LIANG K中研院台灣社會變遷全紀錄,記載各大主題及面向的社會變遷,主要內容來自社會變遷調查 (自 1985 年起),以及其他各種政府統計。

 

但是因為全記錄涵蓋的面向廣、更新不易,希望能建立一個簡便的機制,連結各個議題所使用的「調查問卷題號」與「政府統計」,讓每個議題可以自動化更新所連結的相關數字,並且鼓勵關心不同面向的社群,就這些基礎資料來進行研究或書寫。

 

DDIO J推廣使用方面,希望提供三種層次的資料,讓有興趣的人,可以逐步理解如何使用調查資料:

  1. 第一步是讓有興趣的人,可以先快速瀏覽資料,不用 excel 或太多資料處理,就能˙進行簡單分析,以了解資料特性。例如列出歷年快不快樂指數在性別上的差異。
  2. 第二步是如果覺得資料有趣,那可以開始看一些既有的資料整理,此部份可參見台灣社會變遷全記錄i
  3. 第三步則是拿逐年的原始資料來使用,需要建立起撿變得機制,連結跨年份不同問卷的題目。

 

 

IPA C要解決的問題

 

DDIO J說明問題的 [ PPT] ( https://goo.gl/WRELny )

 

  1. 第一步:建立可供人簡易查詢的界面
  2. 第三步:半自動化連結跨年份的不同問卷 + 連結主計處
    1. CHIA-LIANG Khttp://www.ios.sinica.edu.tw/sc/cht/5.php 每期的問卷的題號不同,需要有「題目」對應「各期題號」的 master table
    2. 「題目」對應已有相關研究與論文(社會所有資料,待整理)
    3. 自動抓取主計總處列管統計

 

    舉例來說:

  1. 婆媳關係研究,
    ddio Juan教育程度 vs 婆婆吵架 by 年份
    ddio Juan性別 vs 婆婆吵架 by 年份

 

使用統計資料:

 

希望有一個工具,每次有新的問卷資料或者統計資料,就能自動更新這篇文章的圖表。

 

RONNY W資料下載位置:

 

 

DDIO J資料特性

  • 欄位大多數是離散的,如性別、(和婆婆吵架是不好、有點不好、好),
    • 教育程度、收入相對連續,但也是切成區間,收入使用區間中位數當作值
  • 是隨機抽樣,所以有反應當時的人口狀況,跨年份比較時,不用再平均

 

ET B預定使用者

DDIO J給想要了解台灣社會狀況,願意拿資料來作初步分析的人

 

IPA C預定功能

  1. DDIO J可以透過簡單的操作,針對整理過的統計資料,產生兩個變量(或再加上時間)的圖表。
  2. #needpeople 需要有人協助半自動化~

 

CHIA-LIANG K現有類似專案

IPA C(現成的是否可以直接使用?或者有什麼不足之處?國外專案可參考?)

 

ET B相關專案

IPA C(衍生自某專案/衍生出某專案/API串接自某專案.)

 

CHIA-LIANG K台灣發展經驗實證資料庫 有更多其他

https://www.most.gov.tw/hum/ch/list?menu_id=27c85f1c-c983-4f2f-8191-7183a1ac6778

 

中研院調查研究專題研究中心有提供線上分析,但是一樣未串接跨期的資料,需要手動選用;且需註冊

http://140.109.171.222/webview/index.jsp?object=http://140.109.171.222:80/obj/fStudy/C00221_1

 

貧富差距 https://g0v.hackpad.com/Ko9q8O2Y1rr

 

世銀統計與我國統計對照 (ronnywang 有一次提的, 連結待補)

 

IPA C授權方式

 

CHIA-LIANG KCode: MIT

Document: CC-BY

 

IPA C使用資料

 

CHIA-LIANG K中研院社會變遷調查原始資料 - 目前為學術用,正與計畫主持人溝通轉為開放授權

 

ET B專案目前狀態

 

CHIA-LIANG K規劃

 

ET B利益揭露

 

CHIA-LIANG K提供 use case 的的中研院社會所研究員與其研究領域相關,

 

 

    IPA C徵求協作者

 

LANFON發起人/拋磚人:

  • 淑華NeedsWriter: 需要文案幫手(撰寫基本資訊、報導專案etc)
  • NeedsDesigner: 需要介面設計
  • NeedsData: 需要資料(擷取、清理)
  • NeedsTech: 需要技術支援(程式、架站 etc)
  • NeedsProcess: 需要幫忙設計作業流程
  • NeedsTalkingToRealPerson: 需要有人幫忙和其他機關聯絡

 

 

    ET B細節(非技術背景可跳填)

 

ET B協作工具

 

進度與 to-do

  • DDIO J第一步 - 簡易查詢界面
    • 建立堪用的網站,讓路人可以自己編輯/試用圖表
    • 確認資料授權
    • 編輯說明文件
    • 自動對應編碼與問題,以及各數值代表的意義,顯示在網頁上
  • 第三步 - 半自動化資料連結

 

 

    ET B成果展示(規劃文件、雛形/草稿、原型/初稿、正式發佈/完稿)

 

RONNY W如果有做出成果可以往這邊丟丟看

 

不同年齡對於離婚是否有錯看法(1=非常錯; 2=相當錯; 3=有點錯; 4=沒有錯)

 

 

不同調查年份對於離婚是否有錯看法變化(1=非常錯; 2=相當錯; 3=有點錯; 4=沒有錯)

 

DDIO J用 Grafana + InfluxDB 來作簡易版視覺化工具

 

http://140.109.240.72/dashboard/db/po-xi-chao-jia-20-nian-bian-hua-tu

 

所有欄位同時是 field 也是 tag ,所以可以同時使用,匿名可編輯不可存檔。

 

婆媳吵架 20 年變化:

 

編輯界面:

 

  1. 先點 FROM,選 basic_88
  2. 再點 SELECT ,選擇想要的欄位
  3. 再點 GROUP BY 的 + 號,選想要的第二象限

 

    ddio Juan目前跑在弱弱的aws t2.medium 上,好像很容易被玩壞 XD 想玩的請自架用上面的 git 架,全都自動化惹~~
    ddio Juan看起來蠻好用的...下一步可能應該用議題來推這樣的應用...感謝!