Ilmu Data

Apa itu dan mengapa hal itu penting

Ilmu data adalah bidang multidisiplin yang secara luas menggambarkan penggunaan data untuk menghasilkan wawasan. Tidak seperti bidang terkait data yang lebih khusus, seperti penambangan data atau rekayasa data, ilmu data mencakup siklus hidup lengkap dari menerjemahkan data mentah menjadi informasi yang dapat digunakan dan menerapkannya untuk tujuan produktif dalam berbagai aplikasi.

Evolusi ilmu data

Ketika menelusuri asal-usul ilmu data, banyak yang berpikir kembali ke tahun 1962, ketika matematikawan John Tukey mengisyaratkan disiplin dalam makalah maninya The Future of Data Analysis . Di dalamnya, ia menggambarkan keberadaan “ilmu yang tidak dikenal”, yang melibatkan pembelajaran dari data.

Akan lebih membantu, bagaimanapun, untuk memeriksa ilmu data di dunia modern. Munculnya data besar – dimungkinkan oleh lompatan dalam kemampuan pemrosesan dan penyimpanan – telah membawa peluang yang belum pernah terjadi sebelumnya bagi organisasi untuk mengungkapkan pola tersembunyi dalam data dan menggunakan wawasan ini untuk meningkatkan pengambilan keputusan. Tetapi untuk melakukannya, mereka harus terlebih dahulu mengumpulkan, memproses, menganalisis, dan membagikan data itu. Mengelola siklus hidup data ini adalah inti dari ilmu data.

Saat ini, data science ada di mana-mana di dunia bisnis – dan di luarnya. Sedemikian rupa sehingga Harvard Business Review menjuluki ilmuwan data sebagai pekerjaan paling seksi di abad ke-21. Jika ilmuwan data adalah praktisinya, data science adalah teknik dan teknologinya.

Manufaktur

Menyebarkan model terbaik ke dalam produksi

Sebagai produsen material konstruksi global, USG harus menghasilkan produk berkualitas tinggi dengan harga terjangkau. Dengan menerapkan SAS® Model Manager, produsen Sheetrock dapat memilih formulasi bahan baku yang optimal dan menyesuaikan proses produksinya hampir seketika untuk mencapai tujuan tersebut.

Ilmu data di dunia saat ini

Dapatkan sekilas tentang dunia modern ilmu data.

Pengalaman Ilmu Data

Jelajahi contoh nyata ilmu data dalam tindakan dengan video, artikel, dan webinar sesuai permintaan dari ilmuwan data warga.

Dorong Inovasi Analitik Melalui SAS® dan Integrasi Sumber Terbuka

E-book ini memberikan panduan untuk berinovasi dalam organisasi modern dengan mengintegrasikan perangkat lunak open source dengan SAS dalam ilmu data.

Ilmu Data dan Seni Persuasi

Ringkasan webinar Harvard Business Review ini menjelaskan apa yang harus dilakukan tim ilmu data untuk mencapai kesuksesan yang lebih besar dan keterampilan yang harus dikembangkan oleh ilmuwan data untuk meningkatkan efektivitas mereka secara keseluruhan.

Pusat Sumber Daya Ilmu Data

Pusat sumber daya ini penuh dengan semua yang Anda butuhkan untuk melengkapi pelatihan Anda sebagai ilmuwan data. Termasuk video, artikel, webinar, dan materi pembelajaran lainnya. Topik praktis meliputi penceritaan data, penelitian ilmiah, dan wawancara sains data Anda.

Kuadran Ajaib Gartner untuk Ilmu Data

Penasaran bagaimana berbagai platform ilmu data menumpuk? Jelajahi Magic Quadrant Gartner untuk Ilmu Data dan Platform Pembelajaran Mesin untuk membandingkan 20 penawaran teratas.

Siapa yang menggunakan ilmu data?

Anda akan kesulitan menemukan industri yang tidak memasukkan ilmu data ke dalam fungsi bisnis yang penting. Berikut adalah beberapa kasus penggunaan yang paling menarik.

Perawatan Kesehatan

Meningkatnya permintaan untuk perawatan berbasis nilai dan siklus penemuan obat yang lebih cepat telah mempercepat adopsi ilmu data dalam perawatan kesehatan. Di bidang pencitraan medis saja, AI dan analitik sekarang membantu meningkatkan akurasi diagnostik, menambah dokter dan ahli radiologi, dan meningkatkan pemberian perawatan pasien.

Retail

Untuk bersaing dengan Amazon dunia, peritel harus dapat dengan cepat memenuhi kebutuhan pelanggan menggunakan teknologi ilmu data seperti analitik prediktif. Melakukannya dapat membantu memperkirakan tingkat permintaan, mengelola permintaan yang berfluktuasi, dan membuat korelasi antara tren dan hubungan di seluruh rantai pasokan.

Sektor Publik

Ketika volume dan kompleksitas keputusan meningkat di seluruh pemerintahan, lembaga beralih ke ilmu data untuk meningkatkan akurasi, keadilan, dan kecepatan keputusan tersebut. Baca bagaimana pemerintah di seluruh dunia menggunakan analitik untuk membuat jutaan keputusan penting setiap hari.

Perbankan

Bagi bank, ilmu data lebih dari sekadar tren – begitulah cara bisnis dilakukan. Dengan banyaknya kasus penggunaan mulai dari deteksi penipuan hingga kecerdasan pelanggan hingga manajemen risiko, ilmu data kini menjadi kekuatan pendorong di balik keputusan bisnis penting dan pembeda kompetitif dalam lanskap keuangan yang padat.

Keluaran ilmu data

Untuk memahami banyak cara ilmu data dapat memengaruhi suatu organisasi, ada baiknya untuk memeriksa beberapa tujuan dan hasil umum ilmu data. 

  • Prediksi (ketika suatu aset akan gagal).
  • Klasifikasi (pelanggan baru atau lama).
  • Rekomendasi (jika Anda suka, coba ini).
  • Deteksi anomali (pembelian palsu).
  • Pengenalan (gambar, teks, audio, video, dll.).
  • Wawasan yang dapat ditindaklanjuti (dasbor, laporan, visualisasi).
  • Proses dan pengambilan keputusan otomatis (persetujuan kartu kredit).
  • Skoring dan peringkat (skor kredit).
  • Segmentasi (pemasaran yang ditargetkan).
  • Optimasi (peningkatan manufaktur).
  • Prakiraan (memprediksi penjualan dan pendapatan).

Jika Anda ingin meningkatkan pekerjaan ilmu data Anda dengan pemahaman yang lebih baik dalam memilih, menerapkan, dan mengelola model, maka menjelajahi lebih banyak pelatihan di AI dan ML sangat ideal. Ronald van Loon Principal Analyst CEO of Intelligent World

AI komposit

Sebagian besar proyek AI saat ini mengandalkan beberapa teknologi ilmu data. Menurut Gartner, menggunakan kombinasi teknik AI yang berbeda untuk mencapai hasil terbaik disebut "AI komposit."

Dengan AI komposit, Anda mulai dengan masalah dan kemudian menerapkan data dan alat yang tepat untuk memecahkan masalah. Ini sering kali mencakup penggunaan kombinasi teknik ilmu data, termasuk ML, statistik, analitik lanjutan, penambangan data, peramalan, pengoptimalan, pemrosesan bahasa alami, visi komputer, dan lainnya. 

AI komposit semakin identik dengan ilmu data. Itu karena memilih teknologi AI yang tepat untuk digunakan tidak selalu mudah. Ini membutuhkan pemahaman mendalam tentang masalah bisnis yang Anda coba selesaikan dan data yang tersedia untuk menyelesaikannya. Kombinasi keahlian bisnis dan teknologi ini adalah inti dari ilmu data. 

Cara kerja ilmu data

Data science melibatkan penggunaan beberapa alat dan teknologi untuk memperoleh informasi yang berarti dari data terstruktur dan tidak terstruktur. Berikut adalah beberapa praktik umum yang digunakan oleh ilmuwan data untuk mengubah informasi mentah menjadi wawasan yang mengubah bisnis.

Manajemen data  adalah praktik mengelola data untuk membuka potensinya bagi suatu organisasi. Mengelola data secara efektif memerlukan strategi data dan metode yang andal untuk mengakses, mengintegrasikan, membersihkan, mengatur, menyimpan, dan menyiapkan data untuk analitik. 

Pembelajaran mesin mengotomatiskan pembuatan model analitik. Dengan pembelajaran mesin tanpa pengawasan, teknologi ini menggunakan metode dari jaringan saraf, statistik, riset operasi, dan fisika untuk menemukan wawasan tersembunyi dalam data tanpa diprogram secara eksplisit ke mana harus mencari atau apa yang harus disimpulkan.

A Jaringan saraf adalah sejenis pembelajaran mesin yang terinspirasi oleh cara kerja otak manusia. Ini adalah sistem komputasi yang terdiri dari unit yang saling berhubungan (seperti neuron) yang memproses informasi dengan merespons input eksternal, menyampaikan informasi di antara setiap unit.

Pembelajaran mendalam menggunakan jaringan saraf besar dengan banyak lapisan unit pemrosesan, memanfaatkan kemajuan dalam daya komputasi dan teknik pelatihan yang ditingkatkan untuk mempelajari pola kompleks dalam jumlah data yang besar. Aplikasi umum termasuk pengenalan gambar dan ucapan.

Visi komputer bergantung pada pengenalan pola dan pembelajaran mendalam untuk mengenali apa yang ada dalam gambar atau video. Ketika mesin dapat memproses, menganalisis, dan memahami gambar, mesin tersebut dapat menangkap gambar atau video secara real time dan menafsirkan sekitarnya.

Pemrosesan bahasa alami adalah kemampuan komputer untuk menganalisis, memahami, dan menghasilkan bahasa manusia, termasuk ucapan. Tahap selanjutnya dari NLP adalah interaksi bahasa alami, yang memungkinkan manusia untuk berkomunikasi dengan komputer menggunakan bahasa sehari-hari untuk melakukan tugas.

Visualisasi data adalah penyajian data dalam format gambar atau grafik sehingga dapat dengan mudah dianalisis. Hal ini sangat penting untuk memungkinkan organisasi membuat keputusan bisnis berdasarkan hasil upaya ilmu data. 

Bahasa pemrograman populer untuk ilmu data

Sama seperti manusia menggunakan berbagai macam bahasa, hal yang sama berlaku untuk ilmuwan data. Dengan ratusan bahasa pemrograman yang tersedia saat ini, memilih yang tepat tergantung pada apa yang ingin Anda capai. Berikut ini beberapa bahasa pemrograman ilmu data teratas. 

Python adalah bahasa pemrograman tingkat tinggi yang ditafsirkan, berorientasi objek, dengan semantik dinamis. Struktur data bawaan tingkat tinggi, dikombinasikan dengan pengetikan dinamis dan pengikatan dinamis, membuatnya sangat menarik untuk pengembangan aplikasi yang cepat, serta bahasa skrip atau lem untuk menghubungkan komponen yang ada.

R adalah lingkungan perangkat lunak gratis untuk komputasi statistik dan grafik yang didukung oleh R Foundation for Statistical Computing. Bahasa R banyak digunakan di antara ahli statistik dan penambang data untuk mengembangkan perangkat lunak statistik dan analisis data.

SQL adalah bahasa khusus domain yang digunakan dalam pemrograman dan dirancang untuk mengelola data yang disimpan dalam sistem manajemen basis data relasional (RDBMS) atau untuk pemrosesan aliran dalam sistem manajemen aliran data relasional (RDSMS). Hal ini sangat berguna dalam menangani data terstruktur, yaitu data yang menggabungkan hubungan antara entitas dan variabel.

SAS adalah bahasa pemrograman yang dipercaya oleh ratusan ribu ilmuwan data di seluruh dunia. Platform SAS Viya memungkinkan Anda untuk menggabungkan manfaat dari setiap sistem teknologi dan bahasa pemrograman di organisasi Anda untuk pengembangan dan penerapan model analitik yang lebih baik. Baca bagaimana SAS Viya dapat membantu mengubah model peleburan Anda menjadi keputusan bisnis yang lebih cerdas .

Langkah berikutnya

Jika Anda ingin belajar ilmu data, SAS adalah tempatnya.

Solusi ilmu data

Penawaran data science SAS Viya menampilkan manajemen data yang kuat, visualisasi, analitik canggih, dan kemampuan manajemen model untuk mempercepat data science di organisasi mana pun.

Penambangan Data Visual dan Pembelajaran Mesin SAS memungkinkan Anda untuk memecahkan masalah analitik paling kompleks dengan satu solusi kolaboratif yang terintegrasi – sekarang dengan API pemodelan otomatisnya sendiri.

SAS Visual Analytics memberi Anda sarana untuk menyiapkan laporan secara interaktif dengan cepat, menjelajahi data Anda melalui tampilan visual, dan melakukan analisis Anda secara swalayan.

Solusi ini dan lainnya didukung oleh SAS Viya, platform ilmu data terdepan di pasar SAS yang berjalan pada arsitektur modern, skalabel, dan mendukung cloud.