開放資料新聞產生器

編輯歷史

時間 作者 版本
2017-07-03 07:11 (unknown) r2
顯示 diff
- 開放資料新聞產生器
+ 開放資料新聞產生器
*感謝 whisky 提供「開放資料新聞產生器」這個新專案名稱 XD
(70 行未修改)
2017-07-01 14:56 – 14:56 (unknown) r0 – r1
顯示 diff
+ 開放資料新聞產生器
+
+ *感謝 whisky 提供「開放資料新聞產生器」這個新專案名稱 XD
+
+ *專案簡介
+
+ *
+ https://speakerdeck.com/poga/xin-wen-chan-sheng-qi
+
+ 預定使用者
+ 資料提供者、資料分析者
+
+ 預定功能
+ 自動分析資料內容,抓出可以簡單呈現的部分:
+ *排序:最新、最大、最多
+ *地圖:地點、地址、座標
+ *推論資料型態/欄位規則:哪些欄位可能是 tag、可能是 pkey、可能是 ISO-3316-1(?)
+ *parse utility:
+ *time parser
+ *what is pkey?
+ *primary key XD
+ *哈, 不是啦, 我是說可以寫個功能是找出pkey
+ *喔喔~ :+1:
+ *
+
+ 現有類似專案
+ google fusion table
+ https://support.google.com/docs/answer/6280499?hl=en
+ http://sheethub.com
+
+ 相關專案
+ https://g0v.github.io/color/
+ dbpedia
+ schema.org
+
+ 授權方式
+ 程式:MIT
+ 其他:CC-BY?
+
+ 使用資料
+
+ 專案目前狀態
+ http://github.com/g0v/datasmith
+ toolchain:
+ https://github.com/poga/postabular
+
+ *實作細節(非技術背景可跳填)
+
+ 協作工具
+ *github repo:http://github.com/g0v/datasmith
+ *hackfoldr 工作資料夾網址:
+ *google drive 共用資料夾網址:
+
+ 進度與 to-do
+ *處理資料囉唆到腦羞,所以跑去先做了方便處理 tabular data 的 https://github.com/poga/postabular
+
+
+ *過去討論紀錄
+ 欄位類型判斷方式
+
+ 台灣地區名稱
+ *判斷方式:判斷欄位內容是否出現台灣縣市名,或是地區名
+ *參考資料集:
+ *https://github.com/g0v/datasmith/blob/master/cities.csv
+ *https://github.com/g0v/datasmith/blob/master/areas.csv
+ *
+ *原始資料來源:
+ *http://www.post.gov.tw/post/internet/Download/all_list.jsp?ID=2201#dl_txt_s_A0206
+ 甲殼類名稱
+ *判斷方式:判斷欄位內容是否出現甲殼類名稱
+ *參考資料集:
+ *https://sheethub.com/cloud.culture.tw/%E5%85%B8%E8%97%8F%E7%9B%AE%E9%8C%84-%E7%94%B2%E6%AE%BC%E9%A1%9E