Ökoinfomatik

번은 200/160 섭씨 도에서 10분 정도.
괜찮았다 저녁으로.
 
저작자 표시 비영리 변경 금지
신고
0

0

수업은 학사, 석사, 박사 과정들이 섞여서 듣는다. 원래는 학사와 석사가 분리되지 않았던 나라이다 보니, 상대적으로 학사 과정에 대한 기대감이 높은 편이다. 그리고 논문도 보면 잘 쓰고, 괜찮다. 물론 어쩔 수 없이 학사로 분리되면서 수준을 낮출 수 밖에 없겠지만 멀지 않은 미래에. 


소프트웨어는 GEO 단대에서 수업 듣다가 문득 재밌겠다 싶어서 캡쳐해 본 것. 전산실 시스템은 윈도우지만 실제 연구자들은 유닉스 계열을 반절 정도는 쓴다. 설치된 프로그램도 오픈소스가 꽤 많은 걸 알 수 있다. 기억해 보면 90년대 후반 한국 대학도 전산실은 유닉스 계열였는데 (그래서 배우기 어려웠던 생각은 분명 든다) 어떻게 보면 나름 긴 컴퓨터 이용의 역사에서 윈도우가 서버 빼고 거의 모든 시장을 완벽하게 석권했던 건 2000년 부터 7-8년 정도라고 봐야지 않나 싶다. 개인컴퓨터 시장은 그보다 조금 더 일찍 시작했지만, 그래도 완전히 독점했던 건 10년이 못 되는 것 같다. 
전반적으로 커리큘럼에서는 R의 강세가 두드러지고, 위의 설치된 소프트웨어들도 많은 것이 R로 흘러들어가고 있다.  
GEO 단대는 위의 소프트웨어를 종합적으로 쓰는 과정이라는 것이 사실 흥미로운 이유다. 내가 학부 들어갈 때 기대했던 '지구환경시스템공학'이 대충 이런거 아니었나 싶은 그런 아쉬운 점이 쫌 있다.  

저작자 표시 비영리 변경 금지
신고
0

0

나는 평균에 대해 이야기 할 때와 특정한 개체에 대해 이야기 할 때를 구분하려 애쓴다. 그리고 개인을 바탕으로 끌어낸, 혹은 아주 적은 표본에서 어떤 집단의 평균에 대해 이야기 하는 것을 꺼리는 편이다. 표본을 바탕으로 이야기 할 때는, 너무 당연하지만 표본의 수와 표집에 있어서 편의를 고려해야 한다. 주관적이고 사전적인 믿음을 집어넣고 싶을 때도 가급적이면, 물론 계산을 하면서 이야기 할 수 없지만, 믿음을 계속 취득하는 자료를 바틍으로 갱신해서 이야기 해야 한다는 강박을 가진다. 
오늘 글 몇 개를 보다가, 이 얘기를 하는 것이 어쩌면 내가 평생 할 일이 될지도 모르겠단 느낌을 가지게 됐다. 이의 불가능성에 대해 자주 생각한다 하지만.  

--------

불가능성에 대해.
한동안 지키던 의견은 이랬다. 어떤 목적과 상황에 적절한 설명의 복잡성(길이로 치환하자)이 있다. 여기에 척도 개념을 넣기도 했지. 한강의 수질 정화를 통한 하구 주거지역의 경제적 후생 극대화란 목적을 두고 상류 하천의 생태계 (수질로 단순화 하자)를 기술할 때 적절한 설명의 길이가 있다, 는 식이었다. 이 설명의 길이와 내용은 서울시 물수지를 계산할 때 고려할 수 있는 상류 하천 생태계에 대한 적절한 설명과는 전연 관계가 없다는 아이디어였고, 아주 간단한 두 개의 다른 목적(목적함수)를 위한 현상의 기술도 결코 동일할 수 없고, 가산 불가능할 것이다란 아이디어. 그래서 이 맥락에서 생태계 서비스의 합산을 위한 모든 시도를 공박했다.
그래도 하나의 목적 (명확하게 시공간적 척도가 특정된)을 위한 설명, 혹은 기술에는 최적의 내용을 찾을 수 있다는 일종의 기대, 희망은 있었다. 모든 사람이 통계를 더 잘 알고, 잘 쓰면 도달할 수 있을 것 같은 이상적인 담화에 대한 꿈이 있었다, 모든 사람의 통계학자화. 
근데 그게 가능한가, 실질적으로 백만인에게 통계 교육을 할 수 없다는 것, 교육을 받는다고 다들 동일하고 충분히 고도화된 이해에 도달 할 수 있을지에 대한 의심을 차치하고나서도, 아주 단순한 한 가지 목표 혹은 의미에 대해서도 최적의 통계학적 자료 설명, 규격화가 가능한가에 대한 회의가 들었다 잠깐. 이게 수학적 바탕을 가지고 얘기할 수 있으면 좋은데 실력이 없는 것이 안타깝다.
사실 여기서 취할 수 있는 접근이 여러가지 있을 건데.. 하나 적고 나중에 추가하도록 하자.
- 가용한 자료를 중심에 놓고 그 자료를 기준점으로 하여 최적의 설명 방법을 찾는 것. 이걸 자료와 모형의 적합성으로 끌어내려와서 얘기하면 전통적으로 그리고 여전히 다뤄지고 발전하고 있는 통계적 적합의 문제로 축소할 수 있을 것이다만, 그 보다 조금 더 많은 걸 한 번에 다루고 싶었다. 사실 그리고 일반적으로 가장 좋은 설명 이나 기술(혹은 단순화해서는 모형)을 찾는 것이 불가능하다고 널리 통계학에서는 가르쳐지고 있는데, 한 두 가지 정리를 이용해서 어떻게 얘기해야 할 지는 좀 더 생각해 봐야겠음. 있지만 자료에 침투한 무작위성 때문에 우리가 알 수 없다고 단순히 얘기하는 것이 더 좋을지, 더 세련되게 아예 불가능하다고 얘기해야 할 지 많이 헷갈린다. 연결해서 생각할 수 있는 것이 애로우 불가능성 정리도 있고 할텐데 뭐 그냥 막 연결시키면 안 될 것 같고 검토가 충분히 되어야 할 것임.. 생각이 꼬리를 무는 건, 어디선가 많이 듣던 얘기고 많이 연구되었는데 그냥 내가 모르고 있는 것 같다는 느낌 사실;
- 관련된 인간, 집단, 행위자, 시스템의 이해와 요구를 가용한 자료라는 제약보다 위에 놓고 최적의 기술을 찾아야 한다는 주장은 어떨까. 아니 이건 첫 번째랑 분명히 갈리지 않았다. 더 생각해 봐야해..
    - 암묵적으로 가정된 이해와 효용 함수가 정치적이기 때문에 (당연히 정치적이지 않다고 말 할 순 없다. 아니 그냥, 정치적으로 결정되었다) 그걸 중심으로 놓고 주 논의를 부칠 수도 있다. FTA 효과 연구에서 GDP 극대화를 하냐 1인당 GDP 추정량의 분산을 같이 보냐 이런 식으로 생각해 볼 수 있을 거시다. 섹터 별로 따로 평가해 볼 수도 있고, 계산 방법의 오류 지적하는 반박 만큼이나 흔히 볼 수 있는 사례. 
   

이어서 계속.. 

 
저작자 표시 비영리 변경 금지
신고
0

0

티스토리 툴바