Contents

原住民族資料分析線上讀書會:R的基礎與應用

課程介紹與目的

建立這個工作坊的啟發源自「紐約時報」 “ Training the Next Generation of Indigenous Data Scientists ” 這篇報導,藉此我們也應該提升我們自己的原住民族與族群事務從業人員的資料分析能力,之後可將這些分析技術應用在族群政策評估、文化資料,甚至是語言資料的保護上。

另外,隨著資料科學(data science)的分析與應用逐漸受重視,R作為一套免費開放原始碼工具,無論在學術分析研究與商業使用上相當受歡迎。在政策分析、統計運算與視覺化上,R也是許多學者或政策分析從業人員喜歡使用的分析工具。而此次課程設計主要聚焦在R語言的基礎概念建立與資料分析應用,希望幫助原住民同學(或有興趣的朋友)學習R的基本指令與運作生態。此外,本課程也鼓勵來上課的同學,把自己學業或工作上所需要分析的資料帶過來,透過所學的指令應用在自己的計畫或工作項目。同時,課程也安排簡單的上機實作,實體演練真實的官方資料。

本課程屬於R語言中入門的階段,並以案例問題為教學導向,主要透過R編寫代碼完成獨立分析。課程大致上聚焦在幾個主題:R入門概念與tidyverse、資料結構、函數設計、非常基礎的基礎統計、文字分析應用(Quatitative Text Analysis)與機器學習(machine learning)於社會科學的應用與實現。

講師 (Instructors)

  • 廖彥傑 (Kacing)
    太魯閣族,秀林人目前為英國艾塞克斯大學(University of Essex)政府系博士生與兼任研究助理(research officer)。研究興趣為原住民分配政治、政黨競爭與極化、態度與意識空間估計(Ideal Point Estimation)與計算社會科學研究(Computational Social Science)。

  • 黃柔翡
    目前是紐約州立大學水牛城分校(University at Buffalo, SUNY)博士候選人,現在為中央研究院人文社會科學博士候選人培育人員。研究興趣為威權政治、選舉問責、公共財分配、外援。

軟體環境

  • R 4.0
  • RStudio Desktop
  • 安裝R與Rstudio

課表

  • 每週六碰面,課程一堂共1小時40分鐘。一堂課會聚焦在三個基本觀念,一次15-20分鐘觀念講授(lecture),10-15分鐘實作(lab),3次循環。
  • 上課互動筆記白板

第一週 (7/17 PM19:00)

  • 講課 : 作業環境安裝(R與RStudio關係)、基礎R語言、資料結構與套件導入、R的社群生態
  • 教學檔案 : PDFHTML | files

第二週 (7/24 PM19:00)

  • 講課 : 向量(vector)、序列(list)、矩陣(matrix)、資料框架(dataframe)與新型資料框架(tibbles)
  • 實作演練 : 台東縣議員建議款分配的政治分析 Rmd | html
  • 教學檔案 : PDFHTML | files | 共同作業

第三週(8/7 PM19:00)

第四週 (8/21 PM19:00)

  • 講課 : Tidyverse 模組系列(二)、迭代循環(Iteration)、資料視覺化EDA
  • 教學檔案 : PDFHTML | files

第五週 (8/28 PM19:00 )

  • 講師 : 黃柔翡 博士候選人
  • 講課 : 用R檢視地圖資料、地圖packages介紹和應用、製作互動式地圖
  • 教學檔案 : HTMLfiles

實作資料

  • 台灣政經傳播研究多年期研究規劃:一般民眾定群追蹤面訪調查資料 、文官定群追蹤網路調查資料
  • 台灣選舉與民主化調查
  • The British Election Study (英國選舉資料)
  • The British Election Study Expert Survey (英國選舉專家調查)

備註

  • 將會使用google meet 的方式進行,因此請大家務必填寫信箱,將會使用google行事曆,告知大家上課時間及日期。
  • 上課日期:7月17日至8月14日, 每堂課於PM19:00至PM20:30m
  • 課程完全免費,有關上課資訊或連結請洽「台灣原住民族太魯閣族學生青年會」(email:trukuyouth@gmail.com)。