Pembelajaran Mesin

Apa itu dan mengapa hal itu penting

Pembelajaran mesin adalah metode analisis data yang mengautomasi pembuatan model analitik. Ini adalah cabang dari kecerdasan buatan yang berdasarkan ide bahwa sistem dapat belajar dari data, mengidentifikasi pola dan mengambil keputusan dengan sedikit intervensi manusia.

Evolusi pembelajaran mesin

Karena teknologi komputasi yang baru, pembelajaran mesin saat ini tidak seperti pembelajaran mesin di masa lampau. Teknologi ini terlahir dari pengenalan pola dan teori bahwa komputer dapat belajar tanpa perlu diprogram untuk menjalankan tugas-tugas khusus; periset yang tertarik dengan kecerdasan buatan ingin melihat apakah komputer dapat belajar dari data. Aspek berulang dari pembelajaran mesin adalah penting karena ketika model terpapar pada data baru, model dapat beradaptasi secara mandiri. Model tersebut belajar dari komputasi sebelumnya guna menghasilkan keputusan dan hasil yang andal dan dapat diulang. Ini bukanlah sains baru – namun sains yang telah mendapatkan momentum baru#.

Sementara banyak algoritme pembelajaran mesin telah ada sejak lama, kemampuan untuk secara otomatis menerapkan perhitungan matematika kompleks untuk big data– berulang-ulang dan benar-benar lebih cepat –merupakan perkembangan terbaru. Berikut adalah beberapa contoh aplikasi pembelajaran mesin yang dipublikasikan secara luas yang mungkin Anda kenal:

  • Yang ramai diperbincangkan, mobil Google yang dapat mengemudi sendiri? Intisari dari pembelajaran mesin.
  • Rekomendasi penawaran online seperti dari Amazon dan Netflix? Aplikasi pembelajaran mesin untuk kehidupan sehari-hari.
  • Mengetahui pendapat pelanggan tentang Anda di Twitter? Pembelajaran mesin digabungkan dengan pembuatan aturan linguistik.
  • Deteksi penipuan? Salah satu penggunaan yang lebih jelas dan penting di dunia kita saat ini.

 

Pembelajaran Mesin dan Kecerdasan Buatan

Sementara kecerdasan buatan (AI) adalah ilmu luas yang meniru kemampuan manusia, pembelajaran mesin adalah bagian spesifik dari AI yang melatih mesin tentang cara belajar. Saksikan video ini untuk memahami dengan lebih baik hubungan antara AI dan pembelajaran mesin. Anda akan melihat bagaimana dua teknologi ini bekerja, dengan contoh yang berguna dan beberapa sisi yang unik.

Mengapa pembelajaran mesin penting?

Minat yang muncul dalam pembelajaran mesin adalah karena faktor serupa yang telah membuat penambangan data dan analisis Bayesian lebih populer dari sebelumnya. Hal-hal seperti meningkatnya volume dan variasi data yang tersedia, pemrosesan komputasi yang lebih murah dan lebih kuat, serta penyimpanan data yang terjangkau.

Semua hal ini berarti mungkin dengan cepat dan otomatis menghasilkan model yang dapat menganalisis data yang lebih besar, lebih kompleks, dan memberikan hasil lebih cepat dan lebih akurat – bahkan dalam skala yang sangat besar. Dan dengan membangun model yang tepat, organisasi memiliki peluang yang lebih baik untuk mengidentifikasi peluang yang menguntungkan – atau menghindari risiko yang tidak diketahui.

 

Apa yang dibutuhkan untuk menciptakan sistem pembelajaran mesin yang baik?

  • Kemampuan persiapan data.
  • Algoritme – dasar dan tingkat lanjut.
  • Proses automasi dan berulang.
  • Skalabilitas.
  • Pemodelan ansambel.
Infografis pembelajaran mesin

Takukah Anda?

  • Dalam pembelajaran mesin, suatu target disebut label.
  • Dalam statistik, suatu target disebut variabel dependen.
  • Variabel dalam statistik disebut fitur dalam pembelajaran mesin.
  • Transformasi dalam statistik disebut penciptaan fitur dalam pembelajaran mesin.

Pembelajaran mesin di dunia saat ini

Dengan menggunakan algoritme untuk membangun model yang mengungkap koneksi, organisasi dapat membuat keputusan yang lebih baik tanpa campur tangan manusia. Pelajari selengkapnya tentang teknologi yang membentuk dunia tempat kita tinggal ini.

Buku Putih

Kesempatan dan tantangan untuk pembelajaran mesin dalam bisnis

Laporan resmi O'Reilly ini memberikan panduan praktis guna mengimplementasikan aplikasi pembelajaran mesin dalam organisasi Anda.

Baca laporan resmi

Pembelajaran mesin memberi kekuatan penilaian kredit

Bagaimana pembelajaran mesin dapat membuat penilaian kredit lebih efisien? Cari tahu bagaimana lembaga penilaian kredit dapat menggunakannya untuk mengevaluasi aktivitas konsumen guna memberikan hasil yang lebih baik bagi kreditor. 

Lihat artikel

Akankah pembelajaran mesin mengubah organisasi Anda?

Laporan Harvard Business Review Insight Center ini melihat bagaimana pembelajaran mesin akan mengubah perusahaan dan cara kami mengelolanya.   

 Unduh laporan

Menerapkan pembelajaran mesin pada IoT

Pembelajaran mesin dapat digunakan untuk mencapai tingkat efisiensi yang lebih tinggi, terutama ketika diterapkan pada Internet of Things. Artikel ini mengeksplorasi topik tersebut.

Baca artikel IoT

Analitik tingkat lanjut dari SAS


Pembelajaran mesin bukanlah teknologi khusus semata; pembelajaran ini melibatkan perangkat lunak seperti penambangan data dan analitik tingkat lanjut untuk menyisir data dalam jumlah besar dan menggali wawasan. SAS® solusi ditanamkan dengan algoritme inovatif yang menyelesaikan tugas dengan mudah.

Pelajari selengkapnya tentang solusi analitik dari SAS

Siapa yang menggunakannya?

Sebagian besar industri yang bekerja dengan sejumlah besar data telah mengakui nilai teknologi pembelajaran mesin. Dengan mengumpulkan wawasan dari data ini – seringkali secara waktu nyata – organisasi dapat bekerja lebih efisien atau mendapatkan keuntungan lebih dari pesaing.

Layanan keuangan

Bank dan bisnis lain dalam industri keuangan menggunakan teknologi pembelajaran mesin untuk dua tujuan utama: untuk mengidentifikasi wawasan penting dalam data, dan mencegah penipuan. Wawasan ini dapat mengidentifikasi peluang investasi, atau membantu para investor mengetahui kapan harus melakukan perdagangan. Penambangan data juga dapat mengidentifikasi klien dengan profil berisiko tinggi, atau menggunakan pengawasan siber untuk menunjukkan tanda-tanda peringatan penipuan.

Pemerintah

Instansi pemerintah seperti keselamatan publik dan utilitas memiliki kebutuhan khusus atas pembelajaran mesin karena instansi tersebut memiliki banyak sumber data yang dapat ditambang wawasannya. Menganalisis data sensor, misalnya, mengidentifikasi cara-cara guna meningkatkan efisiensi dan menghemat uang. Pembelajaran mesin juga dapat membantu mendeteksi penipuan dan meminimalkan pencurian identitas.

Layanan Kesehatan

Pembelajaran mesin adalah tren yang tumbuh cepat di industri layanan kesehatan, berkat munculnya perangkat yang dapat dikenakan dan sensor yang dapat menggunakan data untuk menilai kesehatan pasien secara waktu nyata. Teknologi ini juga dapat membantu ahli medis menganalisis data guna mengidentifikasi tren atau bendera merah yang mungkin mengakibatkan meningkatnya diagnosis dan pengobatan. 

Pemasaran dan penjualan

Situs web merekomendasikan barang yang mungkin Anda sukai berdasarkan pembelian sebelumnya menggunakan pembelajaran mesin untuk menganalisis riwayat pembelian Anda – dan mempromosikan barang lain yang mungkin Anda minati. Kemampuan untuk menangkap data, menganalisisnya, dan menggunakannya untuk mempersonalisasi pengalaman belanja (atau menerapkan kampanye pemasaran) adalah masa depan retail.

Minyak dan gas

Menemukan sumber energi baru. Menganalisis mineral dalam tanah. Memprediksi kegagalan sensor kilang. Merampingkan distribusi minyak agar menjadi lebih efisien dan hemat biaya. Jumlah kasus penggunaan pembelajaran mesin untuk industri ini begitu luas – dan masih terus berkembang.

Transportasi

Menganalisis data untuk mengidentifikasi pola dan tren adalah kunci untuk industri transportasi, yang bergantung pada pembuatan rute yang lebih efisien dan memprediksi potensi masalah untuk meningkatkan profitabilitas. Analisis data dan aspek pemodelan pembelajaran mesin adalah alat penting untuk perusahaan pengiriman, transportasi umum, dan organisasi transportasi lainnya.

Apa saja metode pembelajaran mesin yang populer?

Dua metode pembelajaran mesin yang paling banyak diadopsi adalah pembelajaran yang disupervisi dan pembelajaran yang tidak disupervisi – tetapi ada juga metode pembelajaran mesin lainnya. Berikut ini ikhtisar dari tipe yang paling populer.

Algoritme pembelajaran yang disupervisi dilatih menggunakan contoh berlabel, seperti input di mana output yang diinginkan diketahui. Misalnya, sebuah perlengkapan bisa saja memiliki poin data berlabel “F” (failed/gagal) atau “R” (runs/berjalan). Algoritme pembelajaran menerima satu set input bersama dengan output yang sesuai, dan algoritme belajar dengan membandingkan output yang sebenarnya dengan output yang benar untuk menemukan kesalahan. Algoritme kemudian memodifikasi model tersebut dengan tepat. Melalui metode seperti klasifikasi, regresi, prediksi dan peningkatan gradien, pembelajaran yang disupervisi menggunakan pola untuk memprediksi nilai-nilai label pada data tambahan yang tidak berlabel. Pembelajaran yang disupervisi umumnya digunakan dalam aplikasi tempat data bersejarah memprediksi kemungkinan peristiwa masa mendatang. Misalnya, pembelajaran ini dapat mengantisipasi kapan transaksi kartu kredit kemungkinan merupakan penipuan atau mana nasabah asuransi yang kemungkinan akan mengajukan klaim.

Pembelajaran tidak disupervisi digunakan terhadap data yang tidak memiliki label bersejarah. Sistem ini tidak diberi tahu "jawaban yang benar." Algoritme harus mencari tahu apa yang sedang ditampilkan. Tujuannya adalah untuk mengeksplorasi data dan menemukan beberapa struktur di dalamnya. Pembelajaran yang tidak disupervisi berfungsi dengan baik pada data transaksional. Misalnya, pembelajaran ini dapat mengidentifikasi segmen pelanggan dengan atribut serupa yang kemudian dapat diperlakukan serupa pula dalam kampanye pemasaran. Atau pembelajaran ini dapat menemukan atribut utama yang memisahkan segmen pelanggan satu sama lain. Berbagai teknik populer termasuk peta pengorganisasian mandiri, pemetaan tetangga terdekat, penggugusan k-means, dan dekomposisi nilai tunggal. Algoritme-algoritme ini juga digunakan untuk membuat segmen topik teks, merekomendasikan barang, dan mengidentifikasi data outlier.

Pembelajaran yang semi disupervisi digunakan untuk aplikasi yang sama dengan pembelajaran yang disupervisi. Tetapi pembelajaran ini menggunakan data yang berlabel dan tidak berlabel untuk pelatihan – biasanya sejumlah kecil data berlabel dengan sejumlah besar data tanpa label (karena data yang tidak berlabel lebih murah dan membutuhkan upaya yang lebih sedikit untuk memperolehnya). Jenis pembelajaran ini dapat digunakan dengan metode seperti klasifikasi, regresi, dan prediksi. Pembelajaran yang semisupervisi berguna saat biaya yang terkait dengan pelabelan terlalu tinggi untuk memungkinkan proses pelatihan yang sepenuhnya berlabel. Contoh awal mencakup pengidentifikasian wajah seseorang pada web cam.

Pembelajaran penguatan sering digunakan untuk robotika, game, dan navigasi. Dengan pembelajaran penguatan, algoritme melakukan penemuan melalui trial and error di mana tindakan menghasilkan ganjaran terbesar. Jenis pembelajaran ini memiliki tiga komponen utama: agen (pelajar atau pembuat keputusan), lingkungan (semua yang berinteraksi dengan agen) dan tindakan (apa yang dapat dilakukan oleh agen). Tujuannya adalah agar agen memilih tindakan yang memaksimalkan ganjaran yang diharapkan selama waktu tertentu. Agen akan mencapai tujuan lebih cepat dengan mengikuti kebijakan yang baik. Jadi, tujuan dalam pembelajaran penguatan adalah untuk mempelajari kebijakan terbaik.

Manusia biasanya dapat membuat satu atau dua model yang bagus dalam seminggu; pembelajaran mesin dapat menciptakan ribuan model dalam seminggu.

Thomas H. Davenport, Analytics thought leader
kutipan dari The Wall Street Journal

Apa perbedaan antara penambangan data, pembelajaran mesin, dan pembelajaran yang mendalam?

Meskipun semua metode ini memiliki tujuan yang sama – untuk mengekstraksi wawasan, pola, dan hubungan yang dapat digunakan untuk membuat keputusan – metode ini memiliki pendekatan dan kemampuan yang berbeda.


Penambangan data

Penambangan data dapat dianggap superset dari banyak metode berbeda untuk mengekstraksi wawasan dari data. Yang dapat melibatkan metode statistik tradisional dan pembelajaran mesin. Penambangan data juga menerapkan berbagai metode dari berbagai macam area guna mengidentifikasi pola yang tidak diketahui sebelumnya dari data. Hal ini dapat mencakup algoritme statistik, pembelajaran mesin, analitik teks, analisis rangkaian waktu, dan area analitik lainnya. Penambangan data juga mencakup studi dan praktik penyimpanan data serta manipulasi data.

 


Pembelajaran Mesin

Perbedaan utama dengan pembelajaran mesin adalah sama seperti model statistik, tujuannya adalah memahami struktur data – menyesuaikan distribusi teoretis dengan data yang dipahami dengan baik. Jadi, dengan model statistik ada teori di balik model yang terbukti secara matematis, tetapi metode ini membutuhkan data yang memenuhi asumsi kuat tertentu juga. Pembelajaran mesin telah dikembangkan berdasarkan kemampuan untuk menggunakan komputer guna menyelidiki data untuk struktur, bahkan jika kita tidak memiliki teori seperti apa struktur itu. Tes untuk model pembelajaran mesin adalah kesalahan validasi pada data baru, bukan tes teoretis yang membuktikan hipotesis nol. Karena pembelajaran mesin sering menggunakan pendekatan berulang untuk belajar dari data, pembelajaran dapat dengan mudah diautomasi. Laluan dijalankan melalui data sampai ditemukan pola yang kuat.


Pembelajaran mendalam

Pembelajaran mendalam menggabungkan kemajuan dalam daya komputasi dan jenis jaringan saraf khusus untuk mempelajari pola rumit dalam sejumlah besar data. Teknik pembelajaran mendalam saat ini merupakan teknik terkini untuk mengidentifikasi objek dalam gambar dan kata-kata dalam suara. Para peneliti sekarang berupaya untuk menerapkan keberhasilan ini dalam pengenalan pola untuk tugas-tugas yang lebih kompleks seperti terjemahan bahasa otomatis, diagnosis medis, dan banyak masalah sosial serta bisnis penting lainnya.

Bagaimana Cara Kerjanya

Untuk mendapatkan nilai maksimal dari pembelajaran mesin, Anda harus tahu cara memasangkan algoritme terbaik dengan alat dan proses yang tepat. SAS menggabungkan warisan yang kaya dan canggih dalam statistik dan penambangan data dengan kemajuan arsitektur baru untuk memastikan model Anda berjalan secepat mungkin – bahkan di lingkungan perusahaan besar.

Algoritme: Antarmuka pengguna grafis SAS membantu Anda membangun model pembelajaran mesin dan menerapkan proses pembelajaran mesin berulang. Anda tidak harus menjadi seorang ahli statistik yang canggih. Pilihan lengkap algoritme pembelajaran mesin kami dapat membantu Anda dengan cepat mendapatkan nilai dari big data Anda dan disertakan dalam banyak produk SAS. Algoritme pembelajaran mesin SAS meliputi:

Jaringan neural
 
Pohon keputusan
 
Random forest
 
Asosiasi dan penemuan urutan
 
Peningkatan dan pengantongan gradien
 
Mesin vektor pendukung
 
Pemetaan tetangga terdekat
 
Penggugusan k-means
 
Peta pengelolaan mandiri
 
Teknis optimasi pencarian lokal (mis, algoritme genetik)
 
Maksimalisasi ekspektasi
 
Spline regresi adaptif multivariasi
 
Jaringan Bayesian
 
Kernel density estimation
 
Analisis komponen utama
 
Dekomposisi nilai tunggal
 
Model campuran Gaussian
 
Pembuatan aturan pencakupan berurutan
 

 

Alat dan Proses: Seperti yang kita ketahui sekarang, ini bukan hanya algoritme. Pada akhirnya, rahasia untuk mendapatkan nilai paling banyak dari big data Anda terletak pada pasangan algoritme terbaik untuk tugas yang ditangani dengan:

Manajemen dan kualitas data yang menyeluruh
 
GUI untuk membangun model dan aliran proses
 
Eksplorasi data interaktif dan visualisasi hasil model
 
Perbandingan berbagai model pembelajaran mesin untuk mengidentifikasi yang terbaik dengan cepat   
 
Evaluasi model ansambel yang diautomasi untuk mengidentifikasi para pelaku terbaik
 
Penyebaran model yang mudah sehingga Anda bisa mendapatkan hasil yang dapat diulang dan dapat diandalkan dengan cepat
 
Sebuah platform terintegrasi, end-to-end untuk automasi proses data-ke-keputusan
 

Apa Anda membutuhkan beberapa panduan dasar tentang algoritme pembelajaran mesin mana dan digunakan untuk apa? Blog oleh Hui Li, seorang ilmuwan data di SAS ini menyediakan lembar contekan yang praktis.