2016 가을학기

소셜네트워크 데이터마이닝과 분석

담당교수

수업 시간 및 강의실

  • 월요일 9:30 – 12:30
  • 강의실: 83-601

Course Resources

수업개요

소셜 컴퓨팅(social computing)과 라지데이터 분석(large data analysis) 등이 커뮤니케이션 분야에서도 중요한 이슈로 부상함에 따라 컴퓨터공학을 전공하지 않은 연구자들도 소셜 네트웍 시스템의 기술적, 구조적 특성을 이해할 필요가 있다. 이 수업에서는 스크립팅 프로그래밍 언어인 파이썬(Python)을 사용하여 컴퓨터 프로그래밍의 기초를 학습하고, 웹 기반 기술(web technology), 데이터베이스 등의 관련 기술에 대한 학습을 통해 실제로 소셜 네트워크 데이터를 수집하고 분석하는 방법을 배운다.

강의내용

  1. 파이썬을 이용한 기초 프로그래밍
  2. 웹 기반 기술(web technology)
  3. 소셜 데이터 마이닝(social data mining)을 통한 데이터 분석

교재 (참고서적)

Course Schedule

< 강의계획서 >

Week 1: Introduction to Social Computing

  • What is Social Computing?
  • What is Computer Programming?
  • Why use Python?

Week 2: Python Crash Course 1

Lab Codes | Exercise

  • Python Basics
  • Using Github

Week 3: Python Crash Course 2

Lab Codes | Exercise

  • Python Basics

Week 4: Data Processing

Lab Codes | Solution Codes

  • Data cleaning process

Topic 1: Social Computing Background

Week 5: Data Analysis Using NumPy and Pandas 1

Lab Codes | Solution Codes

  • numpy와 pandas를 활용한 데이터의 분석

Topic 2: Socialogical Concepts

Week 6: Data Analysis Using NumPy and Pandas 2

Lab Codes | Solution Codes | Assignment 3 Template

  • numpy와 pandas를 활용한 데이터의 분석

Topic 3: SNS & Internet 1

Week 7: Text Data Processing

Lab Codes | Solution Codes | Assignment 4 Template

  • NLTK를 활용한 텍스트의 처리
  • KoNLPy를 활용한 한글 텍스트의 처리

Topic 4: SNS & Internet 2

Week 8: Web Technologies

Extra Slide | Extra Lab Codes

  • History of data communication
  • History of HTML & CSS
  • Basic HTML & CSS

Topic 5: Network

Week 9: Social Data Mining 1

Lab Codes | Solution Codes

  • Crawling data from websites
  • Crawling data from complex websites

Topic 6: Twitter & Facebook

Week 10: Social Data Mining 2

Lab Codes | Twitter Streaming Code | Crawling Using Selenium Code | Assignment 5 Template

  • Crawling data from Twitter
  • Crawling data from Other Social Media
  • Using external API for data analysis

Topic 7: Crowdsourcing

Topic 8: Human-Computation

Week 11: Statistical Data Analysis

Lab Codes | Assignment 6 Template

  • 통계적 추론방법의 학습
  • Regression의 학습
  • 클러스터링 방법론 학습

Topic 9: Analysis Methods: Case Studies 1

Topic 10: Analysis Methods: Case Studies 2

Week 12: Project idea presentation

Week 13: Team Meeting

Week 14: Team Meeting

Week 15: Final Presentation (Final Paper Submit)

과제 및 평가

  • Assignment 1: 2 CodeCademy course complete (5+5 points)
  • Assignment 2: Python coding exercise (10 points)
  • Assignment 3: Data cleanup exercise (10 points)
  • Assignment 4: Text data processing (10 points)
  • Assignment 5: Webpage crawling (15 points)
  • Assignment 6: Twitter crawling (15 points)
  • Team Project: Project & Paper (40+40 points)
  • Paper Review: 10 points each
  • Peer Review: 30 points
  • if (absent >= 5): fail