開放資料新聞產生器
Poga Po感謝 whisky 提供「開放資料新聞產生器」這個新專案名稱 XD
專案簡介
*
https://speakerdeck.com/poga/xin-wen-chan-sheng-qi
預定使用者
資料提供者、資料分析者
預定功能
自動分析資料內容,抓出可以簡單呈現的部分:
- 排序:最新、最大、最多
- 地圖:地點、地址、座標
- 推論資料型態/欄位規則:哪些欄位可能是 tag、可能是 pkey、可能是 ISO-3316-1(?)
- parse utility:
- time parser
- what is pkey?
primary key XD
哈, 不是啦, 我是說可以寫個功能是找出pkey
喔喔~ :+1:
現有類似專案
google fusion table
https://support.google.com/docs/answer/6280499?hl=en
相關專案
dbpedia
schema.org
授權方式
程式:MIT
其他:CC-BY?
使用資料
專案目前狀態
http://github.com/g0v/datasmith
toolchain:
https://github.com/poga/postabular
實作細節(非技術背景可跳填)
協作工具
- github repo:http://github.com/g0v/datasmith
- hackfoldr 工作資料夾網址:
- google drive 共用資料夾網址:
進度與 to-do
處理資料囉唆到腦羞,所以跑去先做了方便處理 tabular data 的 https://github.com/poga/postabular
過去討論紀錄
欄位類型判斷方式
台灣地區名稱
- 判斷方式:判斷欄位內容是否出現台灣縣市名,或是地區名
- 參考資料集:
- https://github.com/g0v/datasmith/blob/master/cities.csv
- https://github.com/g0v/datasmith/blob/master/areas.csv
- 原始資料來源:
甲殼類名稱
- 判斷方式:判斷欄位內容是否出現甲殼類名稱
- 參考資料集: