d|Bootcamp Taipei 共筆 - 資料視覺化:簡介與討論

編輯歷史

時間 作者 版本
2017-07-03 04:30 (unknown) r2
顯示 diff
- d|Bootcamp Taipei 共筆 - 資料視覺化:簡介與討論
+ d|Bootcamp Taipei 共筆 - 資料視覺化:簡介與討論
時間:2015/08/21 15:30 ~ 16:30
(83 行未修改)
2017-07-01 14:39 – 14:39 (unknown) r0 – r1
顯示 diff
+ d|Bootcamp Taipei 共筆 - 資料視覺化:簡介與討論
+
+ 時間:2015/08/21 15:30 ~ 16:30
+ 講師:李慕約
+ 解答版:https://docs.google.com/spreadsheets/d/1SVfx5jRxSQkKVpB2Nn1TUnVYzQVFtZQXaLFfmpza4Ho/edit#gid=0
+
+
+
+ *table 是 HTML table 的意思,所以只要是抓表格就是用 table
+ *1 是指網頁從上面數下來第一個表格,同理要抓第二個表格可以用 2
+ *thank you!!
+
+
+ d|Bootcamp Taipei 共筆 - 資料視覺化:簡介與討論
+ 時間:2015/08/21 15:30 ~ 16:30
+ 講師:李慕約 / SheetHub.com 共同創辦人
+ *
+
+
+ 準備
+
+ https://drive.google.com/folderview?id=0BwcMEBpS0DppflpFZ2k1WXQtOTZEa1M0Z0VMY20xZnNxdkpobW02RkVnZmtpbExxRlJqd3M&usp=sharing
+
+ 總表
+ https://docs.google.com/spreadsheets/d/1AvtnyA6KuSaJm9CMFswYCrCHtkW-Lf3U8SR1IUJJFh0/edit#gid=0
+
+
+ 中選會網址:http://db.cec.gov.tw/histQuery.jsp?voteCode=20120101T1A2&qryType=ctks
+
+
+ 預處理
+
+ *抓取選舉資料: vhttp://db.cec.gov.tw/histQuery.jsp?voteCode=20120101T1A2&qryType=ctks
+ *Ctrl + v
+ *=importHTML
+
+ =IMPORTHTML("http://db.cec.gov.tw/histQuery.jsp?voteCode=20120101T1A2&qryType=ctks", "table", 1)
+
+ *請問要如何知道是"table", 1 ?
+ *理論上是因為這是這一個頁面的第幾個表格,但實際操作,我自已都是 try-and-error
+
+ =if(ISBLANK(B2),A1,B2)
+ *請問這一行是什麼意思呢?功能是什麼
+ =Sheet1!A1
+ *複製一個待加工的資料表用的參照
+ *填在 A1 格,然後拉到整張資料表
+
+ *清理空白欄位
+ *手工
+ *函式
+ *顯示原始來源、整理原始來源
+
+
+ 邏輯
+
+ *機智問答時間
+ *哪一個政黨的得票數比較多?
+ *哪一個政黨的女性候選人比較多?
+ *哪一個政黨最有效率?
+ *每一個政黨的候選人平均年齡?
+ *連任是不是比較有機會?
+ *女性是不是比較有機會?
+ *每一個縣市的獲勝政黨?
+ *每一個縣市的獲勝性別?
+ *解答:https://docs.google.com/spreadsheets/d/1SVfx5jRxSQkKVpB2Nn1TUnVYzQVFtZQXaLFfmpza4Ho/edit#gid=0
+
+ *因果不等於相關
+
+ 圖表
+ *直條或圓餅
+ *圖例
+ *顏色
+ *逗點(易讀性)
+
+ *重複利用
+
+ 概念
+ *掌握自己的工具:學學寫程式吧 :)
+ *50%-80% 的時間再做資料的準備
+ *資料越來越多:自動化 / 重複利用 / 即時
+
+ http://www.flightradar24.com/data/airplanes/b-16333/#70da51d
+ http://env.g0v.tw/air/
+ http://earth.nullschool.net/
+ https://www.windyty.com/?25.039,121.525,4