最近修了「認知專題:應用認知心理學」這門課,有幾周的主題在談以網路資料來做資料分析的研究。一篇在談twitter喜怒訊息與心臟病的相關性、一篇在談(我忘記了)。之後老師請我們想一些使用臉書資料能做的研究、以及查找該怎麼抓取資料。
如果真的能用來做研究的話,應該滿有趣的。但問題是
- 程式開發能力薄弱啊
- API改版後,隱私保護層級更高了
總之,我對現在我們能做這類研究的可能性滿悲觀的。還是先把找到的東西記錄一下好了
臨時抱佛腳的努力過程
- 先來個舒適的編程界面 - jupyter(連結)
- 寫網路爬蟲的前置作業:安裝 requests 與 BeautifulSoap(連結)
- Requests 的 GET 與 POST(連結)
- BeautifulSoap 的使用、與 Requests 的綜合應用(連結)
- 使用 Python、Graph API 抓取臉書資料(連結)(終於有進展了,灑花)
好處
- 剛開始 Graph API 登場時,大家對他的看法(連結)
限制:Graph API 升級成 2.0 後,存取使用者的權限變嚴格了
API應用
"應該是中國使用者談 Graph API 2.0", 我是马来西亚人, 不是中国哟~
回覆刪除阿~不好意思,看到簡體字,很直覺的認為是中國人寫的博客,忘了不只有中國使用而已 orz
刪除我馬上更正 ~~
呵~ 路过说一句。不建议你用 graph api, 而是模拟 web browser 的 ajax 来 web scraping (login cookie 这里很重要)。理由是 Graph API 速度慢,有 quota 限制,资料少。 再 者, v2.0 脑残的隐私保护, 没 FQL, app review, 我早就不玩 Graph API 很久了。
刪除好喔,感謝建議~
刪除之後如果要繼續探索的話,這個會是很好的方向 ><