본문 바로가기

2014/12

(7)
suddenly 갑자기 노드 하나 다운. -_-;;이런식으로 다운된건 처음이라 좀 황당...원격으로는 할 수 있는 일이 없다보니, 내일 출근하자마자노드 리붓을 해야겠다. 최악의 경우에는 노드 재설치를 해야함.내가 너무 혹사시켰나...;;;
전기공사 그간 워크스테이션과 서버 등이 전기문제를 간혹 일으킨 적이 있어서, 오늘 전기공사를 실시했다. 이젠 별문제 없겠지... 다행히 모든 pc들이 문제없이 작동한다. 다만... 클러스터 서버를 직접 만들어보고 싶은데... 아마 그러면 두고두고 삽질일 것 같아서 아직은 포기. 솔직히 rocks cluster 패키지들이 좀 옛날 것들이다. 설치하기도 좀 골때리고.
시행착오 예전 데이터를 찾아보니 역시나 ips 데이터가 누락되어 있는 것을 발견. 수정작업을 시작했다. 이미 논문이 나간 것이야 어쩔 수 없다치고 (물론 데이터에 문제가 있거나 한 것은 절대 아니다) 앞으로 나갈 것들은 좀더 세밀하게 데이터를 처리해놔야겠다. 덕분에 protein structure work는 좀더 늦어질 듯 싶다. 주말간에 GPCR 건도 완료해야 월요일에 발표하지...
산 책 또 사기 돈 많아서 그런 것도 아니고... 집을 뒤져보면 분명히 있을 것도 같은데 찾다보면 분명히 지금의 이 감정을 살린채로 읽을 수 없을 것 같아서... 바로 구입. 그리고 내 요즘의 화두, 죽음에 대한 책도 한권 구입했다. 오랫만에 음악과 함께 느긋하게 책을 읽어봐야겠다.
IPS 이야기 -1 InterproScan은 참 유용한 툴 같다만... 몇 가지 문제가 있다. 이 문제로 골머리를 앓는 중인데... 나만 그런 줄 알았더니 이런 케이스가 더 있긴하다.바로 몇몇 시퀀스가 작업 중에 누락되는 케이스다. 처음에는 blast2go에서 제공하는 온라인 서비스에서 발견했는데... 어랍쇼... 로컬 머신에서도 발견되었다.무엇이 원인인지는 모르겠다. 경우에 따라 발생빈도도 달라지고. -_-;;예전에 작업했던 파일들을 살펴보니 모두 있다. 잘게 쪼개면 쪼갤수록 적어지긴 하지만... 그러면 시간이 너무 걸리게 된다.예를 들어 14000개의 시퀀스를 14000개의 파일로 나누면 누락이 없어지게 된다.다만 시간이... 대박 걸림. 내 cluster 서버에서도 하루에 4000개 가량 작업할 수 있는 모양이던데....
I-Tasser cluster app 세팅 -2 역시 문제점은 PBS -> SGE 변경으로 인한 script 호환성 문제였다.고쳐야할 부분은 아마도 네 곳 같다. 두 군데는 고쳤고, 두 군데를 더 찾아서 고쳐야 한다. 일단은 전체 시스템 자원의 50%를 사용할 수 있게 된 것 같다. 100%는 무리인 듯.이건 이 프로그램의 문제인 듯. 전체가 openmpi를 쓰는 것이 아니고, 일부분만 쓰는 것이니 이렇게 된 듯 하다. 여튼... 여담인데, 데이터 정리를 더 잘해야 할 듯 싶다.Dell server에 잘 정리해서 두고, link out이 가능하도록 만들어둬야 할 듯.
I-Tasser cluster app 세팅 -1 protein structure prediction 프로그램들을 몇가지 알아보았는데... 제일 나은게 이것 같다.그런데 이게 계산하는 것이 워낙에 많다보니, single thread로는 너무 느리다.거기에다가 이 프로그램은 multi-thread를 지원하지 않는다. 그러므로.... 답은 HPC-cluster를 통한고속화 밖에 답이 없음. 그런데 이 I-Tasser의 parallel mode script가 PBS 기준임 -_-;;SGE를 쓰는 나로서는 손을 보는 수 밖에 없는데... 이건 다시 정리해서 올리도록하고, 일단은 돌아가는지 아침에 확인해야겠음.결국 오늘도 다섯시에 자는구나.... OTL