SAS® Solutions for Hadoop
Hadoop용 SAS® 솔루션
하둡(Hadoop)에는 빅데이터를 저장하고 SAS는
최적의 정보 가치를 제공합니다.
88%의 기업들이 하둡을 기회로 여기고 있습니다. 여러분은 어떠신가요?
빅데이터 저장을 위해 하둡을 도입하셨다면 이제 SAS가 전체 데이터로부터 가치 있는 정보를 도출해내는데 필요한 모든 것을 제공합니다. 광범위한 데이터 관리 – 데이터 준비는 엄청난 시간이 걸리는 일이기 때문입니다. 데이터 탐색 및 시각화, 인메모리 프로세싱, 고급 분석, 그리고 최선의 해답을 제시하는 모델을 신속하게 구현하는 능력 모두 가능합니다.
Data Exploration & Visualization
Understand your data. It's the first step to finding value.
With Hadoop, understanding what your data has to tell you can be challenging. SAS makes it easy to understand. With SAS, you can:
- Interactively explore billions of rows of data in seconds. Visually examine Hadoop data quickly. Look at both structured and unstructured data – like Twitter feeds – to discover when and why your customers' behavior changes.
- Put fast, powerful analytics in the hands of all users. Easy-to-use analytics helps even those with limited technical skills interact with and analyze data on their own.
- Tell others. Whether it's through the web, mobile devices or Microsoft Office applications, you can easily share your findings. Pass it along.
- Self-service, easy-to-use BI designed for large-scale use. Interactive query, reporting and visual data discovery are at your fingertips. Now everyone can glean insights from Hadoop.
- Analytics for everyone. You don't have to be a programmer to use our tried-and-true analytics to get value from Hadoop. Intuitively find relationships, generate forecasts and predict scenarios on the fly.
- Integration with Microsoft Office and mobile devices. You've got a gold mine of information stored in Hadoop. Put your insights where others can easily access, share and use them.
Data Management for Hadoop
Effectively manage big data.
Big data skills are in high demand. Now business users can profile, transform and cleanse data – on Hadoop or anywhere else it may reside – using an intuitive user interface. Data analysts can run SAS code on Hadoop for even better performance. With SAS, you can:
- Access and load Hadoop data fast. Turn big data into valuable data with quick, easy access to Hadoop and the ability to load to and from relational data sources as well as SAS datasets.
- Stop the “garbage in, garbage out” cycle. Integrated data quality delivers pristine data that fuels accurate analytics amplified by the power of Hadoop.
- Put big data to work for you. Transform, filter and summarize data yourself, and get more value from your big data.
- Get more out of your computing resources. Optimize your workloads, and gain high availability across the Hadoop cluster.
- Better productivity through faster management of big data. In-Hadoop data quality and code execution take advantage of MapReduce and YARN to speed the process of accessing trusted data.
- Big data management. Big data is becoming the backbone of business information. We help business and IT work together to deliver big data that's enterprise ready – no need to write code (unless you want to).
- Data you can trust. Make big data better. SAS provides multiple data integration and data quality transformations to profile, parse and join your data without moving it out of Hadoop.
- Data Management
Supercharge your AI journey with seamless data connectivity, enhanced transformations and robust governance. - Service Offerings for Hadoop
Get the most out of your Hadoop data with support, training and resources from SAS.
Interactive Predictive Analytics
Tired of waiting? Get answers now.
Want answers from Hadoop? Churning out a couple of models a week isn’t going to cut it. Neither is waiting hours for analytical results that must be refined further. SAS takes a different approach, so you can:
- Answer questions you never had time to ask. Build and refine predictive models in a visual, intuitive environment. Get results in minutes – even seconds – using in-memory processing.
- Produce better insights. Use diverse data and run more models on-the-fly. Test more ideas and find the best answers.
- Seize new opportunities. With finer, more accurate results you can make the right choices, drive new revenue and improve your bottom line. Put your Hadoop data to work for you.
- In-memory processing for persisting data. SAS reads big data into memory once. It can then be analyzed multiple times. By multiple users. All without having to write data to disk or perform expensive data shuffling.
- Deeper drilling for bigger challenges. Evaluate and refine models to get precise answers. SAS helps you solve problems you could not address before.
- Faster experimentation, better answers. In-memory processing allows you to run frequent modeling iterations to find the results that bring the most value.
Analytics for the Data Scientist
Like coding? You'll love this – real results from Hadoop in seconds.
An all-in-one, interactive environment gives you everything you need to get accurate insights from data in Hadoop. At lightning-fast speed. With SAS, you can:
- Do everything from a single environment. Many users can work simultaneously. Manipulate and prepare data. Explore. Build models. And deploy. We've got the entire analytical life cycle covered.
- Build better models for better results. Create sophisticated models using world-class statistical and machine-learning techniques. Run them against all your Hadoop data.
- Analyze as fast as you think. An interactive, in-memory environment lets you customize your code and get instant results. How fast and creative can you be?
- Scale to meet enterprise needs. More data, more users and complex issues? No problem. Our highly scalable, in-memory environment grows easily as needed.
- Faster results. Build models and quickly run multiple iterations to determine the best performer. Shrink the time from model inception to deployment.
- Ability to persist data in memory. Our unique technology reads in big data once, but you can analyze it multiple times. The result? Greater productivity and turn-on-a-dime creativity.
- Unprecedented analytical power. Powerful statistical and machine-learning techniques, text analytics, a recommendation system and more. Know more, faster.
- One environment for the entire analytical life cycle. You don’t have to switch between different Hadoop languages and technologies to get insights that drive better decisions. You're covered from beginning to end.
Data Scoring in Hadoop
Get models out fast for faster predictive insights and real-time action.
Moving analytical models from design into production can be resource-intensive. But it's crucial to deploy them inside Hadoop as quickly as possible to reap the benefits. With SAS, you can:
- Score data in Hadoop. Don't waste time moving data when you can score it inside Hadoop and quickly turn insights into action.
- Operationalize analytics. We've automated the analytic model deployment process so you can put more models into production faster.
- Score raw data as it comes in. Export not just the model, but the entire workflow – including data preparation and variable transformation logic for scoring.
- Reduced data movement, greater data governance. Score data inside Hadoop instead of moving it. Avoid data latency and replication.
- Streamlined model deployment. Execute your model-scoring processes within Hadoop to avoid manual processing errors and get faster results.
- More productive IT and analytic teams. Faster automated deployment frees your analytics team to focus on developing more models and lets IT focus on strategic projects.
데이터 탐색 & 시각화
데이터 이해하기. 가치를 얻는 첫 단계입니다.
하둡만으로는 어떤 데이터를 보유하고 있는지, 그리고 그것이 무엇을 말하는 지 알기 어렵습니다. SAS를 통해서라면 가능합니다.
- 수십억 개의 데이터 열을 수 초 내에 인터랙티브하게 탐색할 수 있습니다. 하둡 데이터의 신속한 시각적 탐색이 가능합니다. 마치 트위터 피드처럼 정형/비정형 데이터 모두를 살펴보고 고객의 진정한 생각을 파악할 수 있습니다.
- 모든 사용자에게 빠르고 강력한 분석을 제공합니다. 사용하기 쉬운 분석을 통해 제한된 기술력을 보유한 사용자들도 스스로 데이터를 탐색하고 이해하도록 돕습니다.
- 간편하게 공유할 수 있습니다. 웹, 모바일 기기, Microsoft 애플리케이션을 통해 분석결과를 쉽게 공유할 수 있습니다.
- 모두를 위한 SAS® Analytics: 믿을 수 있는 SAS의 분석기법을 이용하면 분석 전문가나 프로그래머가 아니어도 하둡으로부터 가치 있는 정보를 얻을 수 있습니다. 관계를 판단하고 시나리오 예측과 점검을 실시하세요. 프로그래밍은 필요치 않습니다.
- MS 오피스와 모바일 기기와의 통합: 하둡에는 정보의 보고가 저장되어 있습니다. 쉽게 접근과 이용이 가능한 곳에 정보가 위치하도록 합니다.
- 대규모 활용을 위해 고안된 셀프 서비스BI: 쌍방향 조회, BI, 시각화가 독창적인 고급분석과 결합되었습니다. 이제 누구나 하둡에서 가치 있는 정보를 찾아낼 수 있습니다.
하둡 데이터 관리
빅데이터를 저장만 하지 말고, 활용하세요.
초기 빅데이터 프로젝트는 수집과 저장에 초점을 두었습니다. 이제는 데이터 관리에 주목하고 있습니다. 그리고 방대한 데이터를 활용해 차이를 만드는 것이죠. “SAS 라면 가능합니다”
- 하둡 데이터에 빠르게 접근할 수 있습니다. 하둡에 빠르고 쉽게 접근해 빅데이터를 가치 있는 데이터로 변환할 수 있습니다.
- “Garbage in, garbage out”의 악순환을 끊을 수 있습니다. 통합 데이터 저장을 통해 정확한 분석을 촉진하는 양질의 데이터를 제공합니다.
- 빅데이터를 유용하게 만들 수 있습니다. 여러분의 데이터 통합 기술을 재활용해 빅데이터 셋에 집중할 수 있습니다. 잠자고 있는 빅데이터를 깨우세요.
- 보다 빠른 빅데이터 관리: In-Hadoop 데이터 품질과 데이터 통합은 MapReduce와 YARN을 활용해 신뢰할 수 있는 데이터 획득 프로세스의 속도를 높입니다.
- 빅데이터 관리, 부호화 불필요: 빅데이터는 비즈니스 정보의 중추로 부상하고 있습니다. SAS는 IT기술을 이용하여 기업이 즉시 사용할 수 있는빅 데이터를 도출하도록 돕습니다.
- 하둡 데이터 관리: 빅데이터의 품질을 개선합니다. SAS는 Hive와 Pig, MapReduce 용으로 수십 가지의 변환을 제공합니다.
하둡 데이터 분석
더 이상 기다리지 말고 이제 답을 찾으세요.
하둡은 차별화된 접근법을 필요로 합니다. 한 주에 두어 개의 모델을 대량생산하는 것은 충분치 않습니다. 분석결과를 몇 시간씩 기다리는 것도 별 도움이 되지 못합니다. 그러나 “SAS 라면 가능합니다”
- 시간이 없어 묻지 못한 질문에 대한 답을 얻을 수 있습니다. 분산 인메모리 환경에서 예측모델을 생성하고 복잡한 분석을 수행합니다. 단 몇 분, 심지어 몇 초 내에 결과를 얻을 수 있습니다.
- 더 나은 정보를 산출합니다. 다양한 데이터를 활용하고 더 많은 모델을 가동합니다. 다수의 시나리오 평가를 통해 더 많은 아이디어를 테스트하고 더 나은 답을 찾을 수 있습니다.
- 새로운 기회를 잡으세요. 보다 세밀하고 정확한 결과를 토대로 올바른 결정을 내리고, 새로운 수익을 도출해 기업이익을 개선할 수 있습니다. 하둡 데이터를 유용하게 쓸 수 있습니다.
- 인메모리 처리를 통해 빅데이터를 보유할 수 있습니다. SAS를 활용하면, 빅데이터는 일단 메모리로 판독됩니다. 그러면 여러 차례에 걸쳐, 여러 사용자에 의해 분석이 가능합니다. 데이터를 디스크에 기록하거나 광범위한 데이터 셔플링 과정을 거칠 필요도 없습니다.
- 더 심도 있게, 더 많은 과제를 수행할 수 있습니다. 모델 평가와 개선을 통해 정확한 해답을 얻을 수 있습니다. SAS는 이전에 다룰 수 없었던 문제를 해결하도록 돕습니다.
- 더 신속하게 최선의 답을 얻을 수 있습니다. 인메모리 처리를 통한 모델링 반복으로 최고의 가치있는 결과를 얻을 수 있습니다.
분석 모델 구현 & 실행
분석 모델 구현이 빠를수록, 더 큰 가치를 얻을 수 있습니다.
분석 모델을 산출하는 과정에는 많은 자원이 필요할 수 있습니다. 그러나 가능한 빨리 분석 모델을 산출해 수익을 내는 것이 핵심입니다. “SAS 라면 가능합니다”
- 데이터 이동 감소와 데이터 거버넌스를 가능케 합니다. 데이터를 이동시키는 대신 하둡에 기록할 수 있습니다. 데이터 지연시간과 복제를 예방할 수 있습니다.
- 분석 모델 구현을 간소화할 수 있습니다. 하둡 내에서 모델 스코어링 프로세스를 실행해 수작업으로 인한 오류를 방지하고, 결과를 더 신속하게 얻을 수 있습니다.
- IT팀과 분석팀의 생산성을 높입니다. 더욱 신속해진 자동구현을 통해 분석팀은 더 많은 모델 개발을 IT 부서는 전략 프로젝트에 집중할 수 있습니다.
- In-Hadoop 스코어링: 하둡 내에 데이터를 기록할 수 있어 정보의 빠른 실행이 가능합니다.
- 운용 가능한 분석: 모델 구현은 분석작업에서 가치를 얻기 위해 중요한 단계입니다. SAS는 이 프로세스를 자동화해 더 많은 모델을 더욱 신속하게 만들어낼 수 있습니다.
- 원시 데이터가 투입되는 대로 기록: 모델뿐만 아니라 데이터 준비 및 다양한 변환 로직을 포함한 워크플로 전체를 내보내 기록할 수 있습니다.
데이터 과학자 (Data Scientist)를 위한 솔루션
하둡에서 몇 초 만에 결과를 얻을 수 있습니다.
일체형의 인터랙티브 환경은 하둡 내 데이터로부터 정확한 인사이트를 얻는데 필요한 모든 것을 제공합니다. SAS의 전광석화 같은 속도라면 가능합니다.
- 단일 환경에서 모든 것이 가능합니다. 많은 사용자들이 동시에 일할 수 있습니다. 데이터의 조작과 준비, 탐색, 모델 구축과 구현이 동시에 가능합니다. 분석 라이프 사이클 전체를 지원합니다.
- 더 나은 결과를 위해 더 효과적인 분석 모델을 생성할 수 있습니다. 세계적 수준의 통계 및 머신 러닝(Machine Learning) 기법을 활용해 수준 높은 분석 모델을 생성할 수 있습니다. 하둡 데이터 전체에 이를 적용할 수 있습니다.
- 최대한 빠르게 분석할 수 있습니다. 인터랙티브한 인메모리 분석 환경에서는 맞춤형 코드 사용과 즉각적인 결과 도출이 가능합니다.
- 기업 니즈 충족을 위한 확장이 가능합니다. 늘어나는 데이터와 사용자로 인한 더욱 복잡한 이슈는 SAS의 고 확장성, 인메모리 환경을 통해 필요한 만큼 확장 가능합니다.
- 더욱 빠른 결과도출: 모델을 생성하고 신속한 반복 구동을 통해 최상의 모델을 결정할 수 있습니다. 모델 생성에서 구현까지의 시간을 크게 줄일 수 있습니다.
- 인메모리로 데이터 유지 가능: SAS의 독자적인 기술로 빅 데이터의 판독은 한 번에 가능하지만 분석은 여러 번 할 수 있습니다. 그 결과는 생산성과 창의성 증대입니다.
- 전례 없는 분석력: 강력한 통계 및 기계학습 기법, 텍스트 분석, 추천 시스템 등을 통해, 더 많은 정보의 더 빠른 파악이 가능합니다.
- 분석 라이프 사이클 전체에 단일 환경 제공: 더 나은 결정 도출을 위한 정보를 얻으려 여러 하둡 언어와 기술 사이에서 왔다갔다할 필요가 없습니다. 시작부터 끝까지 SAS가 책임집니다.

