고객 성공 사례 /

한국쌔스소프트웨어 ㈜
서울 강남구 대치4동 889-11 대치빌딩 8-10층
전화 (02) 2191-7121
팩스 (02) 2191-7007
www.sas.com/korea

고객 성공 사례

인쇄용인쇄용

성공 사례

 

새로운 약품 개발의 길을 열다

최근 제약 연구는 자동화 기능의 확대로 인해 큰 혜택을 누리고 있습니다. 출시 예정인 약품 화합물을 검사하는 새로운 자동화 기법들은 막대한 양의 데이터를 생산하고 있습니다. 그러나 이러한 미가공 데이터는 그 자체로는 충분치가 않기 때문에, 반드시 활용 가능한 지식으로 전환해 주어야 합니다. 그리고 나아가 이는 향후 연구 작업을 성공적인 제품 생산으로 연결시키는 중요한 요소가 됩니다. Janssen Research Foundation(JRF)의 데이터 마이닝팀은 연구자들에게 이러한 지식을 전달하는 시간을 단축하는 시스템을 개발함으로써, 자사 과학자들에게 경쟁적 이점을 제공하였습니다. 무엇보다 이들에게 필요했던 것은 유연하고 역동적인 소프트웨어 솔루션이었습니다. 특히 기존 데이터베이스를 쉽게 연결시키고, 고급 데이터 마이닝 프로세스 단계에서 사용하는 특정 도구들을 효과적으로 통합할 수 있는 그러한 솔루션이 필요했습니다. 따라서, 이들이 자사의 파트너로 SAS를 선택한 것은 그리 놀라운 일이 아닙니다.

 

확장

효과적인 신약 발견의 성공률은 대개 질병에 대한 능력을 입증할 수 있는 화합물의 수에 달려 있습니다. HTS(High Throughput Screening) 방식의 개발로 인해, JRF의 연구자들은 하루에 최대 100,000개의 화합물을 검사할 수 있게 되었습니다. 불과 몇 년 전 수동적인 방식으로 하루에 겨우 50개의 화합물을 검사하던 때와 비교하면 대단한 발전입니다. 그러나 이로 인한 새로운 데이터의 폭발적인 증가는 약간의 문제를 일으키고 있습니다. JRF, 의약 화학팀의 수석 과학자이자 팀의 과학 프로젝트 책임자인 Michael Engels 박사는 "과거에는 수많은 소중한 정보들이 산더미 같은 데이터 속에 묻혀 있었습니다. 그것이 바로 데이터 마이닝팀을 만들겠다는 결정을 내린 이유이죠. 연구 과학자의 주요 목표는 신약 개발에 필요한 지식과 기술을 개발하는 것입니다. 막대한 양의 데이터를 처리하는 고도로 전문화된 계산 기법 및 기본적인 통계 이론을 숙지하라고 그들의 전문 지식이 필요한 것이 아닙니다."라고 말합니다.

 

쉽게 통합되는 기존 데이터베이스

데이터 마이닝팀은 특정 분야에 관계 없이 연구 중에 있는 JRF의 모든 개발 연구 작업을 지원합니다. 데이터 마이닝팀에게 가장 중요한 첫 번째 작업은 다양한 부서의 모든 데이터를 하나의 전체 데이터 웨어하우스로 모으는 것입니다. IT 팀의 프로젝트 책임자인 Rudi Verbeeck 박사는 “SAS/Warehouse Administrator® 및 기존 Oracle 데이터베이스 간의 원활한 연결에 SAS의 데이터 조작 및 변환 도구가 합세해, 예상했던 것보다 작업이 훨씬 쉬워졌습니다."라고 말합니다. 

“JRF의 각 연구 부서는 그 동안 자체 데이터베이스를 개발해 왔습니다. 생물학자는 기본적으로 화학자와는 다른 방식을 사용합니다. 약리학자 및 생화학자 역시 데이터의 특정 측면에 집중합니다. 이렇게 다양한 모든 관계형 데이터베이스를 통합한다는 것은 초반에 문제를 분석할 당시만 해도 매우 거대하고 복잡한 프로젝트처럼 보였습니다. 그래서 SAS/Warehouse Administrator®가 그래픽 사용자 인터페이스에서 바로 사용자 기존 데이터베이스에 액세스할 수 있는 능력을 제공한다는 사실을 알았을 때 무척 기뻤습니다. 곧바로 JRF는 기본적인 모든 데이터베이스와 자동으로 동기화되는 역동적인 데이터 웨어하우스를 구축했습니다. 게다가 SAS의 시각화 도구를 사용했기 때문에 대부분 단순한 그래픽 구성 정도의 작업이었고, 실제 코딩 작업은 극히 일부였습니다.” 

 

극대화된 통계 라이브러리

데이터 웨어하우스에서 투명하게 제공되는 이러한 정보를 활용해 팀에서는 즉시 데이터 마이닝 작업을 시작할 수 있었습니다. Engels 박사는 "다른 도구들과 비교할 때, SAS/Enterprise Miner®는 강력한 통계 방식을 갖춘 가장 극대화된 라이브러리를 제공합니다. 모델 제작자들이 어떠한 방식을 사용하길 원하든, 로지스틱 회귀 분석이든, 인공 신경 회로망이든 또는 의사 결정 트리든, SAS 소프트웨어의 시각 라이브러리에서는 모든 것들이 즉각적으로 제공됩니다. JRF의 통계 분석 결과 데이터 간에 과거에는 알려지지 않았던, 심지어는 예상치 못한 관계를 찾아낼 수도 있습니다. 그럼 이러한 관계를 연구 부서를 위한 정확한 모델 구축에 활용할 수 있습니다. 즉, SAS 소프트웨어 내에서 직접 분석이 수행된다는 사실은 데이터 마이닝 프로세스를 매우 독창적이고 효과적으로 만들어 줍니다. 또 모델 개발 속도도 크게 단축시킵니다. 그리고 SAS/Enterprise Miner®를 통해 한 번에 다양한 통계 방식들을 비교할 수 있게 되면서, 선택한 모델이 원하는 결과를 산출할 가능성이 가장 높은 모델이라는 사실에 대해서도 더 큰 자신감을 갖게 되었습니다."라고 말합니다.

"연구자들을 위해 데이터가 보다 쉽게 사용할 수 있는 애플리케이션 형태로 변환됩니다. 기본적인 SAS 코드나 통계 이론에 관해 걱정할 필요가 없습니다. 연구자들은 코드 전문가가 되지 않고도, 통계 분석의 지속적인 개선 기능을 활용할 수 있습니다.” 

 

한 번에 데이터 마이닝에서 웹 도구까지

Verbeeck 박사는 “다양한 SAS 소프트웨어 도구들 간의 완벽한 통합을 통해 많은 혜택을 누리고 있습니다. SAS 소프트웨어 도구에 크게 의존하고 있죠. 새로운 연구 애플리케이션 구축을 위해 SAS의 시각화 애플리케이션 개발 도구인 AppDev Studio®를 사용합니다. 이 도구를 사용하면 애플리케이션에 직접 SAS/Enterprise Miner®로 작성한 독자적인 SAS 코드를 결합할 수 있습니다. 그리고 이렇게 하면, 웹 애플리케이션 개발 작업이 단지 사용자 인터페이스 설계 작업과 같이 간단한 작업이 됩니다. 또 AppDev Studio®를 사용하면 끊임없이 변화하는 연구 부서의 요구 사항을 반영할 수 있도록 역동적으로 애플리케이션을 업그레이드할 수 있습니다.”라고 말합니다.  

Janssen Pharmaceuticals, Inc.
SAS 소프트웨어는 전체 데이터 마이닝 프로세스를 지원하고, 항상 최고 수준의 다양한 능력과 사용자 정의 기능 및 유연성과 함께 가장 사용하기 쉬운 그래픽 사용자 인터페이스를 제공합니다. 
 

향후 연구 작업의 길잡이

융통성이 뛰어난 SAS 소프트웨어를 사용하는 데이터 마이닝팀에서는 보다 큰 범위에서 사고를 진행시킬 수 있습니다. “현재 우리는 HTS의 중요한 화합물 발견 비율을 높일 수 있는 혁신적인 애플리케이션 개발을 위해 노력하고 있습니다. 현재는 오직 테스트된 화합물의 약 0.1%만이 실제로 활성화됩니다. 게다가 심지어 최신 검사 시스템에서도 테스트를 수행해야 할 화합물의 수를 감당하기는 어렵습니다. 따라서, 성공률을 높이기 위해서는 사전 선택 과정이 필수적입니다. 예전에는 성공률을 높이는 데 필요한 정보가 막대한 양의 데이터 안에 묻혀 있었습니다. 그러나 이젠 SAS/Enterprise Miner®를 사용해, 이러한 데이터에서 예측 모델을 추출할 수 있습니다. JRF 연구자들의 경우 애플리케이션에 모델을 적용할 경우, 가상 및 기존 화합물 라이브러리에서 가상 검사를 수행할 수 있습니다. 그리고 이처럼 높은 비용을 들이지 않고 쉽게 확보한 결과를 기반으로 연구자들은 검사할 화합물을 보다 능률적으로 선택할 수 있습니다. 또 보다 짧은 시간에 보다 많은 천연 화합물을 발견할 수 있을 것입니다. 뿐만 아니라 제공되는 데이터의 양이 늘어날수록, 자체 학습 예측 모델의 정확성도 높아질 것입니다.” 

 

사용자 정의 능력이 뛰어나고 사용이 간편한 소프트웨어

Engels 박사에 따르면, SAS는 업계 최고의 데이터 마이닝 소프트웨어입니다. "다른 공급업체와 의 비교 과정에서 우리는 매우 포괄적이고 사용자 정의가 가능한 다양한 패키지들을 찾아 볼 수 있었습니다. 그러나 문제는 이들 모두가 철저한 프로그래밍 지식을 요구한다는 것이었습니다. 물론 고도로 전문화되고 사전 프로그래밍을 거친 사용이 간편한 소프트웨어도 발견했습니다. 그러나 이러한 소프트웨어들은 대부분 성공적인 연구에 절대적으로 필요한 항목인 융통성이 부족했습니다. 반면 SAS 소프트웨어는 다양한 능력과 사용자 정의 기능 및 사용자 친숙함까지 제공하며 가장 다양한 시각화 방식의 애플리케이션들을 제공합니다. 그리고 무엇보다 모든 SAS 도구들은 서로 완벽하게 통합되기 때문에, 데이터 마이닝 프로세스가 계속해서 유동적인 움직임을 지속할 수 있습니다."

Copyright © SAS Institute Inc. All Rights Reserved.

Janssen Pharmaceuticals

비즈니스 이슈:
수많은 가치있는 연구 정보들이 방대한 양의 데이터에 의해 숨겨져 있었습니다.
Solution:
SAS Data Integration and Data Mining Solutions.
Benefits:

연구자들을 위해 데이터가 보다 쉽게 사용할 수 있는 애플리케이션 형태로 변환됩니다. 기본적인 SAS 코드나 통계 이론에 관해 걱정할 필요가 없습니다. 연구자들은 코드 전문가가 되지 않고도, 통계 분석의 지속적인 개선 기능을 활용할 수 있습니다.

자세히: