본문 바로가기

카테고리 없음

aws

도저히 안 돼서 aws 사용방법 찾고 있다. 

https://aws.amazon.com/blogs/big-data/running-r-on-aws/

이런 자료가 있는데, 작년에 해 보니까 데이터 주고 받는게 좀 복잡하던데.. 

여튼 cpu 40개에 메모리 244gb 라고 한다. 털썩. 



----

훌륭하신 분들 덕분에 성공

http://datum.io/aws-ec2-rserver-installation1/

한글로 설명된 곳. 특히 여기서 아래의 영국분 사이트 링크를 알게 됐다. 

http://www.louisaslett.com/RStudio_AMI/

서버 설정이 복잡한데, R에 맞게 설정한 서버 인스턴스 복제를 얻을 수 있음. 


datum.io의 설명을 따라가면 쉽게 할 수 있다. 접속되면 패스워드 변경 할 수 있게 R펑션을 만들어 두셨고, dropbox 링크도 준비해 두셨다. 엄청 편리하다. -> 드롭박스 쓸 경우 처음에 무조건 전체 파일을 싱크하니 주의. 네트워크 사용량과 디스크 사용량 고려해서 최소한 폴더만 싱크하게 하거나, 새 계정으로 해서 공유폴더로 주는게 좋을 듯 하다. 

64코어에 256gb를 상시적으로 이용하면 시간 당 3.5불 정도. 엄청 많이쓰면 돈이 좀 많이 들겠으나.. m4.4xlarge 타입은 8코에어 32gb 메모리고 시간당 1불이 채 안된다. 하루 종일 쓰면 2만원 정도. 연속해서 100일 정도 쓰면 컴퓨터를 하나 사는게 나을 듯 하다. 인스턴스 켜고 끄고 자주 하면 되는데 아무래도 번거롭고.. 여튼 안심이 됨 이제. 


---

사용량에 맞춰서 요금을 최적화 하는 것이 가능한데, 고려할 요소가 꽤 많다. 하지만 자동으로 해 주는 프로그램을 짤 수 있다 (api 이용). 

t 타입은 cpu 사용량까지 고려해서 요금 계산을 한다. 서버 켜놓은 시간 / cpu 사용량 / 디스크 점유한 시간 (서버를 꺼도 디스크는 점유) 세 가지 모두 고려해야 함. 순간적으로 cpu 사용량이 변하는 경우 유용. 

m 타입은 켜놓은 시간만 고려하면 되고, 대신 cpu 사용량이 적어도 시간 단위로 돈을 내니까 계속 cpu 사용이 많은 경우에 적합. 

둘 다 디스크와 네트워크 사용은 신경을 써야 함. 자세히 들어가니 복잡하기에, 대충 돈 좀 더 낸다 생각하고 편하게 쓰는 게 좋을 듯 하다. 더 복잡하게 들어가면 on demand라고 항상 내가 컴퓨팅 자원을 쓰는 경우와, 그 보다 요금이 저렴하게 입찰해서 쓰는 방식 등이 있는데 개인 업무에선 신경 안 쓰는 게 삶이 편할 듯. 

대충 보니 cpu는 브로드웰 제온, 하스웰 제온 이라고 보면 되겠다. t 타입의 경우 고가용성으로 뭐 가변적으로 cpu 성능을 얻어오는 것 같은데 잘 모르니 패스..