본문 바로가기

카테고리 없음

4일 째 아침

오늘은 벤자민 발표 있고, 나머지는 그냥 데이터 사이언스 발표를 주욱 즐겨찾기 해 두었다. 어제 Jakob Runge 란 영국에서 공부하는 아마도 포닥일 것 같은 사람 발표 들으면서, 아 이것은 천재의 발표다 생각했다. 내용도 그렇고, 발표 자료 만듦새가.. 

요약하면, 인과 관계를 파악하는 데에 있어서 상관 계수와 그레인저 인과 검정 사이엔 trade-off 가 있고, 그래서 이 사람은 MCI 란 개념을 만들어서 그 둘 사이의 타협점을 찾았다.  인과 관계를 잘 찾고, 그릇된 인과 관계를 탐지하여 제거하고, 그러면서도 검정력을 잃지 않는 방법. 수학적으론 다르나, 랜덤 이펙트 모형을 처음 뵨이 설명해줬을 때랑 비슷한 느낌을 받았다. 여튼 그걸로 인과 관계, 경로 중요 요인을 큰 다변량 시계열 데이터 셋에서 찾는 방법 소개하고, 실습. 

해수면 기압 자료 분석 결과가 인상적 이었다. 이런 종류의 분석에서 제일 멋진게, 별다른 전처리나 가정 없이 분석 했는데 그 결과가 우리가 그동안 쌓아온 지식과 일치하는 것이다. 그니까, 예를 들어서 미국 대법원 판례 분석해서 대법관을 그룹으로 나누었는데 그 결과가 저널리즘에서 대법관들 성향 분석한 결과 (e.g., 진보/보수/중도) 와 일치한다 그런 것. 완벽하진 않지만 해수면 기압 분석 결과가 그런 느낌을 줬다. 반대로, 흥미 없는 분석 결과는 보통 이런 식이다. 뭔가 결론과 토의를 장황하게 했는데, 데이터와 메소드를 보면, 그냥 그렇게 나올 수 밖에 없게 되어 있는 것. 완벽하게 아티팩트인 경우도 있고, 그냥 원하는 결과가 나오도록 계속 데이터, 파라미터, 모델을 고치다 보면 그렇게 나오기도 한다. 여전히, 이번 학회에서도, 그런 발표도 많이 눈에 띈다. 

런지 박사 홈페이지  

http://www.imperial.ac.uk/people/j.runge

포닥 이셨다. 

Runge, J. et al. (2015). Identifying causal gateways and mediators in complex spatio-temporal systems. Nature Communications, 6, 8502. doi:10.1038/ncomms9502

읽어보세;