Ökoinfomatik

4일 째 아침

분류없음2017.04.26 14:29

오늘은 벤자민 발표 있고, 나머지는 그냥 데이터 사이언스 발표를 주욱 즐겨찾기 해 두었다. 어제 Jakob Runge 란 영국에서 공부하는 아마도 포닥일 것 같은 사람 발표 들으면서, 아 이것은 천재의 발표다 생각했다. 내용도 그렇고, 발표 자료 만듦새가.. 

요약하면, 인과 관계를 파악하는 데에 있어서 상관 계수와 그레인저 인과 검정 사이엔 trade-off 가 있고, 그래서 이 사람은 MCI 란 개념을 만들어서 그 둘 사이의 타협점을 찾았다.  인과 관계를 잘 찾고, 그릇된 인과 관계를 탐지하여 제거하고, 그러면서도 검정력을 잃지 않는 방법. 수학적으론 다르나, 랜덤 이펙트 모형을 처음 뵨이 설명해줬을 때랑 비슷한 느낌을 받았다. 여튼 그걸로 인과 관계, 경로 중요 요인을 큰 다변량 시계열 데이터 셋에서 찾는 방법 소개하고, 실습. 

해수면 기압 자료 분석 결과가 인상적 이었다. 이런 종류의 분석에서 제일 멋진게, 별다른 전처리나 가정 없이 분석 했는데 그 결과가 우리가 그동안 쌓아온 지식과 일치하는 것이다. 그니까, 예를 들어서 미국 대법원 판례 분석해서 대법관을 그룹으로 나누었는데 그 결과가 저널리즘에서 대법관들 성향 분석한 결과 (e.g., 진보/보수/중도) 와 일치한다 그런 것. 완벽하진 않지만 해수면 기압 분석 결과가 그런 느낌을 줬다. 반대로, 흥미 없는 분석 결과는 보통 이런 식이다. 뭔가 결론과 토의를 장황하게 했는데, 데이터와 메소드를 보면, 그냥 그렇게 나올 수 밖에 없게 되어 있는 것. 완벽하게 아티팩트인 경우도 있고, 그냥 원하는 결과가 나오도록 계속 데이터, 파라미터, 모델을 고치다 보면 그렇게 나오기도 한다. 여전히, 이번 학회에서도, 그런 발표도 많이 눈에 띈다. 

런지 박사 홈페이지  

http://www.imperial.ac.uk/people/j.runge

포닥 이셨다. 

Runge, J. et al. (2015). Identifying causal gateways and mediators in complex spatio-temporal systems. Nature Communications, 6, 8502. doi:10.1038/ncomms9502

읽어보세; 


저작자 표시 비영리 변경 금지
신고
0

0

EGU 3일 째

분류없음2017.04.26 00:25

친구들 만나서 밥 먹고, 톡 듣고 그렇게 하루 더 보냄. 저녁엔 춘천에서 만났던 이스라엘 교수님이 밥 쏘신대서 가고, 그렇게 잘 지내고 있다. 포스터 쭉 봤고..  오늘 일이 좀 있어서 학회 발표만 듣고 있을 수는 없었는데, 여튼 준비하는 것들 해야 하니까 또..

오늘은 주로 무슨 생각을 했냐면.

EWS 발표는 나쁘진 않았는데, 뭐라 형용할 수 없는 생각이 듬. 벡터자기회귀 모형 접했을 때랑 비슷한 느낌.

Grace 발표 들어갔는데 아무래도 센서, 원자료 처리 쪽은 나랑 좀 멀고, 토양 수분 탐지 하는 쪽으로 더 봐야 할 듯 나는. 여튼 엄청 뭐 발전하고 있는 분야였다.

생각보다 이 학회 (유럽에서 지오사이언스 전체 학회라 지구과학 환경과학 망라)에서 딥러닝 등 방법은 그리 많이 찾아 보기 힘들었다. 몇몇 HPC (high performance computing)발표가 있었는데, 그래도 전체적으로 gpu 사용에 있어선 늦다는 느낌. 잠재력이 있는데, 아직 많이 발전 안 된 것 같다. 아무래도 제일 큰 이유는, 원격 탐사 영상 등에선 공간적 패턴에서 피쳐(feature)를 찾기 어렵기 때문 아닐까? 시간 차원에서 피쳐 찾는 논문은 몇 있었는데 아직 대중화 까진 안 된 듯.

보면 독일 애들이 발표 자료가 보통 튼튼하고, 연습을 많이 한 느낌이 든다. 아무래도 좀 그런게 있어. 스페인 사람들 발표도 괜찮은 것 많았음.

여튼, 고냐 스톱이냐 고민하던 한 가지, 고로 결정 났다. 마리퀴리가 중간에 중단 되었는데, 대신해서 이게 내 어깨에 부담이자, 또 무언가 계기가 되리라 생각했다.


저작자 표시 비영리 변경 금지
신고
0

0

egu 2017

분류없음2017.04.25 11:25

EGU 발표를 마쳤다. 12분 안에 하는 게 참 쉽지가 않다. 세션 시작 15분 남기고 발표 꼭지 2개 중에 하나를, 그러니까 반을 통채로 지웠는데도 시간이 모자라 고생했는데, 지우지 않았다면.. 생각하기만 해도 끔찍하다. 발표 자체는 특히 준비하는 게 좋았다. 하면서 그동안 고민하던 게 좀 정리가 되는 느낌. 이야기를 구성한다는게 이렇게 집중해서 발표를 하거나 논문을 쓰거나 하지 않으면 쉽게 되지 않는 것 같다. 발표때는 다행히 질문도 적절하게 두 개 받았고 뒤에 한 미국 친구가 와서 한참 얘기도 했다. 전체적으로, 모든 내용을 잘 풀진 못했지만 그래도 소개하는 차원에서 괜찮았다, 자평. 이 친구는 미국 지리공간 정보국에서 일하고 있다는데, 들어보니 NSA 같은 곳 이었다. 지금은 국가 안보 뭐;; 하는데, 포닥 하면서 내 발표랑 비슷한 거 했다고 와서 얘기 많이 해 줌. EWS 시그널 분석이 결국 그런 곳에서도 쓰이고 있음을 알았다. 뭐 당연한 건가? 일종의.. ews를 resilience 쪽에서 연구하는 사람들이 일변량 시계열을 분석해서 그 움직임에서 위험 신호를 포착하는 연구가 몇 년 전에 나왔다. 리질리언스에서 얘기하는 티핑 포인트 찾는 간단한 사례로 일변량 시계열을 arma 모형한 뒤에 외부 충격에서 복구되는 리턴 타임이랑 바리언스가 티핑 포인트 근처에서 커지는 것 포착하는 것. 이 친구는 그 방법으로 아프리카나 남미에 질병이나 기후 모형에 적용해서, 위기 신호 포착하는 작업을 하는 거였다. 다시 말하면, 위성으로 그 지역을 보고 있으면서 자동으로 컴퓨터가 시계열 신호를 분석하고, 그러다가 위기, 체제 전환, 티핑 포인트가 오는 것 같으면 경보를 울리는 시스템 개발로 이해. 

이거 뭐 어디든 다 써먹을 수 있다. 시스템에 대한 총적인 정보를 담은 일변량 시계열을 찾을 수 있냐의 문제가 있고, 다변량 시계열에 대해 동일한 방법으로 티핑 포인트 찾는 방법이 있냐 문제가 있고, 여튼 그런 게 갖춰진 조건이면 상당히 유용하게 쓸 수 있는 방법. 

길에서 펭이랑 스벤, 벤 만나서 옛날 얘기하고 그런 것도 좋았고, 뭐 다 좋았다. 비엔나도 좋고, egu에서 공부하는 사람들 보는 것도 좋고. 뭔가 이런, 대충 청바지에 후드티 입고 와서 진지하게 썰 풀고 그런 것 좋다. 학회 장에 공짜 맥주가 풀려서 들고 다니면서 마시다 생각했다. 아 뭔가..  돌아와야 하는 것 아닌가. 




저작자 표시 비영리 변경 금지
신고
0

0

티스토리 툴바