Pembelajaran Mesin
Apa itu dan mengapa hal itu penting
Pembelajaran mesin adalah metode analisis data yang mengautomasi pembuatan model analitik. Ini adalah cabang dari kecerdasan buatan yang berdasarkan ide bahwa sistem dapat belajar dari data, mengidentifikasi pola dan mengambil keputusan dengan sedikit intervensi manusia.
Evolusi pembelajaran mesin
Karena teknologi komputasi yang baru, pembelajaran mesin saat ini tidak seperti pembelajaran mesin di masa lampau. Teknologi ini terlahir dari pengenalan pola dan teori bahwa komputer dapat belajar tanpa perlu diprogram untuk menjalankan tugas-tugas khusus; periset yang tertarik dengan kecerdasan buatan ingin melihat apakah komputer dapat belajar dari data. Aspek berulang dari pembelajaran mesin adalah penting karena ketika model terpapar pada data baru, model dapat beradaptasi secara mandiri. Model tersebut belajar dari komputasi sebelumnya guna menghasilkan keputusan dan hasil yang andal dan dapat diulang. Ini bukanlah sains baru – namun sains yang telah mendapatkan momentum baru#.
Sementara banyak algoritme pembelajaran mesin telah ada sejak lama, kemampuan untuk secara otomatis menerapkan perhitungan matematika kompleks untuk big data– berulang-ulang dan benar-benar lebih cepat –merupakan perkembangan terbaru. Berikut adalah beberapa contoh aplikasi pembelajaran mesin yang dipublikasikan secara luas yang mungkin Anda kenal:
- Yang ramai diperbincangkan, mobil Google yang dapat mengemudi sendiri? Intisari dari pembelajaran mesin.
- Rekomendasi penawaran online seperti dari Amazon dan Netflix? Aplikasi pembelajaran mesin untuk kehidupan sehari-hari.
- Mengetahui pendapat pelanggan tentang Anda di Twitter? Pembelajaran mesin digabungkan dengan pembuatan aturan linguistik.
- Deteksi penipuan? Salah satu penggunaan yang lebih jelas dan penting di dunia kita saat ini.
Pembelajaran Mesin dan Kecerdasan Buatan
Sementara kecerdasan buatan (AI) adalah ilmu luas yang meniru kemampuan manusia, pembelajaran mesin adalah bagian spesifik dari AI yang melatih mesin tentang cara belajar. Saksikan video ini untuk memahami dengan lebih baik hubungan antara AI dan pembelajaran mesin. Anda akan melihat bagaimana dua teknologi ini bekerja, dengan contoh yang berguna dan beberapa sisi yang unik.
Mengapa pembelajaran mesin penting?
Minat yang muncul dalam pembelajaran mesin adalah karena faktor serupa yang telah membuat penambangan data dan analisis Bayesian lebih populer dari sebelumnya. Hal-hal seperti meningkatnya volume dan variasi data yang tersedia, pemrosesan komputasi yang lebih murah dan lebih kuat, serta penyimpanan data yang terjangkau.
Semua hal ini berarti mungkin dengan cepat dan otomatis menghasilkan model yang dapat menganalisis data yang lebih besar, lebih kompleks, dan memberikan hasil lebih cepat dan lebih akurat – bahkan dalam skala yang sangat besar. Dan dengan membangun model yang tepat, organisasi memiliki peluang yang lebih baik untuk mengidentifikasi peluang yang menguntungkan – atau menghindari risiko yang tidak diketahui.
Apa yang dibutuhkan untuk menciptakan sistem pembelajaran mesin yang baik?
- Kemampuan persiapan data.
- Algoritme – dasar dan tingkat lanjut.
- Proses automasi dan berulang.
- Skalabilitas.
- Pemodelan ansambel.
Takukah Anda?
- Dalam pembelajaran mesin, suatu target disebut label.
- Dalam statistik, suatu target disebut variabel dependen.
- Variabel dalam statistik disebut fitur dalam pembelajaran mesin.
- Transformasi dalam statistik disebut penciptaan fitur dalam pembelajaran mesin.
Pembelajaran mesin di dunia saat ini
Dengan menggunakan algoritme untuk membangun model yang mengungkap koneksi, organisasi dapat membuat keputusan yang lebih baik tanpa campur tangan manusia. Pelajari selengkapnya tentang teknologi yang membentuk dunia tempat kita tinggal ini.
Kesempatan dan tantangan untuk pembelajaran mesin dalam bisnis
Laporan resmi O'Reilly ini memberikan panduan praktis guna mengimplementasikan aplikasi pembelajaran mesin dalam organisasi Anda.
Pembelajaran mesin memberi kekuatan penilaian kredit
Bagaimana pembelajaran mesin dapat membuat penilaian kredit lebih efisien? Cari tahu bagaimana lembaga penilaian kredit dapat menggunakannya untuk mengevaluasi aktivitas konsumen guna memberikan hasil yang lebih baik bagi kreditor.
Akankah pembelajaran mesin mengubah organisasi Anda?
Laporan Harvard Business Review Insight Center ini melihat bagaimana pembelajaran mesin akan mengubah perusahaan dan cara kami mengelolanya.
Unduh laporan
Menerapkan pembelajaran mesin pada IoT
Pembelajaran mesin dapat digunakan untuk mencapai tingkat efisiensi yang lebih tinggi, terutama ketika diterapkan pada Internet of Things. Artikel ini mengeksplorasi topik tersebut.
Analitik tingkat lanjut dari SAS
Pembelajaran mesin bukanlah teknologi khusus semata; pembelajaran ini melibatkan perangkat lunak seperti penambangan data dan analitik tingkat lanjut untuk menyisir data dalam jumlah besar dan menggali wawasan. SAS® solusi ditanamkan dengan algoritme inovatif yang menyelesaikan tugas dengan mudah.
Pelajari selengkapnya tentang solusi analitik dari SAS
Siapa yang menggunakannya?
Sebagian besar industri yang bekerja dengan sejumlah besar data telah mengakui nilai teknologi pembelajaran mesin. Dengan mengumpulkan wawasan dari data ini – seringkali secara waktu nyata – organisasi dapat bekerja lebih efisien atau mendapatkan keuntungan lebih dari pesaing.
Layanan keuangan
Bank dan bisnis lain dalam industri keuangan menggunakan teknologi pembelajaran mesin untuk dua tujuan utama: untuk mengidentifikasi wawasan penting dalam data, dan mencegah penipuan. Wawasan ini dapat mengidentifikasi peluang investasi, atau membantu para investor mengetahui kapan harus melakukan perdagangan. Penambangan data juga dapat mengidentifikasi klien dengan profil berisiko tinggi, atau menggunakan pengawasan siber untuk menunjukkan tanda-tanda peringatan penipuan.
Pemerintah
Instansi pemerintah seperti keselamatan publik dan utilitas memiliki kebutuhan khusus atas pembelajaran mesin karena instansi tersebut memiliki banyak sumber data yang dapat ditambang wawasannya. Menganalisis data sensor, misalnya, mengidentifikasi cara-cara guna meningkatkan efisiensi dan menghemat uang. Pembelajaran mesin juga dapat membantu mendeteksi penipuan dan meminimalkan pencurian identitas.
Layanan Kesehatan
Pembelajaran mesin adalah tren yang tumbuh cepat di industri layanan kesehatan, berkat munculnya perangkat yang dapat dikenakan dan sensor yang dapat menggunakan data untuk menilai kesehatan pasien secara waktu nyata. Teknologi ini juga dapat membantu ahli medis menganalisis data guna mengidentifikasi tren atau bendera merah yang mungkin mengakibatkan meningkatnya diagnosis dan pengobatan.
Pemasaran dan penjualan
Situs web merekomendasikan barang yang mungkin Anda sukai berdasarkan pembelian sebelumnya menggunakan pembelajaran mesin untuk menganalisis riwayat pembelian Anda – dan mempromosikan barang lain yang mungkin Anda minati. Kemampuan untuk menangkap data, menganalisisnya, dan menggunakannya untuk mempersonalisasi pengalaman belanja (atau menerapkan kampanye pemasaran) adalah masa depan retail.
Minyak dan gas
Menemukan sumber energi baru. Menganalisis mineral dalam tanah. Memprediksi kegagalan sensor kilang. Merampingkan distribusi minyak agar menjadi lebih efisien dan hemat biaya. Jumlah kasus penggunaan pembelajaran mesin untuk industri ini begitu luas – dan masih terus berkembang.
Transportasi
Menganalisis data untuk mengidentifikasi pola dan tren adalah kunci untuk industri transportasi, yang bergantung pada pembuatan rute yang lebih efisien dan memprediksi potensi masalah untuk meningkatkan profitabilitas. Analisis data dan aspek pemodelan pembelajaran mesin adalah alat penting untuk perusahaan pengiriman, transportasi umum, dan organisasi transportasi lainnya.
Pelajari Selengkapnya Tentang Industri yang Menggunakan Teknologi Ini
- Automotive
- Banking
- Capital Markets
- Casinos
- Communications
- Consumer Goods
- Defense & Security
- Government
- Health Care
- Health Insurance
- High-Tech Manufacturing
- Higher Education
- Hotels
- Insurance
- Life Sciences
- Manufacturing
- Media
- Midsize Business
- Oil & Gas
- P-12 Education
- Retail Analytics
- Sports Analytics
- Travel & Transportation
- Utilities
Apa saja metode pembelajaran mesin yang populer?
Dua metode pembelajaran mesin yang paling banyak diadopsi adalah pembelajaran yang disupervisi dan pembelajaran yang tidak disupervisi – tetapi ada juga metode pembelajaran mesin lainnya. Berikut ini ikhtisar dari tipe yang paling populer.
Algoritme pembelajaran yang disupervisi dilatih menggunakan contoh berlabel, seperti input di mana output yang diinginkan diketahui. Misalnya, sebuah perlengkapan bisa saja memiliki poin data berlabel “F” (failed/gagal) atau “R” (runs/berjalan). Algoritme pembelajaran menerima satu set input bersama dengan output yang sesuai, dan algoritme belajar dengan membandingkan output yang sebenarnya dengan output yang benar untuk menemukan kesalahan. Algoritme kemudian memodifikasi model tersebut dengan tepat. Melalui metode seperti klasifikasi, regresi, prediksi dan peningkatan gradien, pembelajaran yang disupervisi menggunakan pola untuk memprediksi nilai-nilai label pada data tambahan yang tidak berlabel. Pembelajaran yang disupervisi umumnya digunakan dalam aplikasi tempat data bersejarah memprediksi kemungkinan peristiwa masa mendatang. Misalnya, pembelajaran ini dapat mengantisipasi kapan transaksi kartu kredit kemungkinan merupakan penipuan atau mana nasabah asuransi yang kemungkinan akan mengajukan klaim.
Pembelajaran tidak disupervisi digunakan terhadap data yang tidak memiliki label bersejarah. Sistem ini tidak diberi tahu "jawaban yang benar." Algoritme harus mencari tahu apa yang sedang ditampilkan. Tujuannya adalah untuk mengeksplorasi data dan menemukan beberapa struktur di dalamnya. Pembelajaran yang tidak disupervisi berfungsi dengan baik pada data transaksional. Misalnya, pembelajaran ini dapat mengidentifikasi segmen pelanggan dengan atribut serupa yang kemudian dapat diperlakukan serupa pula dalam kampanye pemasaran. Atau pembelajaran ini dapat menemukan atribut utama yang memisahkan segmen pelanggan satu sama lain. Berbagai teknik populer termasuk peta pengorganisasian mandiri, pemetaan tetangga terdekat, penggugusan k-means, dan dekomposisi nilai tunggal. Algoritme-algoritme ini juga digunakan untuk membuat segmen topik teks, merekomendasikan barang, dan mengidentifikasi data outlier.
Pembelajaran yang semi disupervisi digunakan untuk aplikasi yang sama dengan pembelajaran yang disupervisi. Tetapi pembelajaran ini menggunakan data yang berlabel dan tidak berlabel untuk pelatihan – biasanya sejumlah kecil data berlabel dengan sejumlah besar data tanpa label (karena data yang tidak berlabel lebih murah dan membutuhkan upaya yang lebih sedikit untuk memperolehnya). Jenis pembelajaran ini dapat digunakan dengan metode seperti klasifikasi, regresi, dan prediksi. Pembelajaran yang semisupervisi berguna saat biaya yang terkait dengan pelabelan terlalu tinggi untuk memungkinkan proses pelatihan yang sepenuhnya berlabel. Contoh awal mencakup pengidentifikasian wajah seseorang pada web cam.
Pembelajaran penguatan sering digunakan untuk robotika, game, dan navigasi. Dengan pembelajaran penguatan, algoritme melakukan penemuan melalui trial and error di mana tindakan menghasilkan ganjaran terbesar. Jenis pembelajaran ini memiliki tiga komponen utama: agen (pelajar atau pembuat keputusan), lingkungan (semua yang berinteraksi dengan agen) dan tindakan (apa yang dapat dilakukan oleh agen). Tujuannya adalah agar agen memilih tindakan yang memaksimalkan ganjaran yang diharapkan selama waktu tertentu. Agen akan mencapai tujuan lebih cepat dengan mengikuti kebijakan yang baik. Jadi, tujuan dalam pembelajaran penguatan adalah untuk mempelajari kebijakan terbaik.
Manusia biasanya dapat membuat satu atau dua model yang bagus dalam seminggu; pembelajaran mesin dapat menciptakan ribuan model dalam seminggu.
Thomas H. Davenport, Analytics thought leader
kutipan dari The Wall Street Journal
Apa perbedaan antara penambangan data, pembelajaran mesin, dan pembelajaran yang mendalam?
Meskipun semua metode ini memiliki tujuan yang sama – untuk mengekstraksi wawasan, pola, dan hubungan yang dapat digunakan untuk membuat keputusan – metode ini memiliki pendekatan dan kemampuan yang berbeda.
Penambangan data
Penambangan data dapat dianggap superset dari banyak metode berbeda untuk mengekstraksi wawasan dari data. Yang dapat melibatkan metode statistik tradisional dan pembelajaran mesin. Penambangan data juga menerapkan berbagai metode dari berbagai macam area guna mengidentifikasi pola yang tidak diketahui sebelumnya dari data. Hal ini dapat mencakup algoritme statistik, pembelajaran mesin, analitik teks, analisis rangkaian waktu, dan area analitik lainnya. Penambangan data juga mencakup studi dan praktik penyimpanan data serta manipulasi data.
Pembelajaran Mesin
Perbedaan utama dengan pembelajaran mesin adalah sama seperti model statistik, tujuannya adalah memahami struktur data – menyesuaikan distribusi teoretis dengan data yang dipahami dengan baik. Jadi, dengan model statistik ada teori di balik model yang terbukti secara matematis, tetapi metode ini membutuhkan data yang memenuhi asumsi kuat tertentu juga. Pembelajaran mesin telah dikembangkan berdasarkan kemampuan untuk menggunakan komputer guna menyelidiki data untuk struktur, bahkan jika kita tidak memiliki teori seperti apa struktur itu. Tes untuk model pembelajaran mesin adalah kesalahan validasi pada data baru, bukan tes teoretis yang membuktikan hipotesis nol. Karena pembelajaran mesin sering menggunakan pendekatan berulang untuk belajar dari data, pembelajaran dapat dengan mudah diautomasi. Laluan dijalankan melalui data sampai ditemukan pola yang kuat.
Pembelajaran mendalam
Pembelajaran mendalam menggabungkan kemajuan dalam daya komputasi dan jenis jaringan saraf khusus untuk mempelajari pola rumit dalam sejumlah besar data. Teknik pembelajaran mendalam saat ini merupakan teknik terkini untuk mengidentifikasi objek dalam gambar dan kata-kata dalam suara. Para peneliti sekarang berupaya untuk menerapkan keberhasilan ini dalam pengenalan pola untuk tugas-tugas yang lebih kompleks seperti terjemahan bahasa otomatis, diagnosis medis, dan banyak masalah sosial serta bisnis penting lainnya.
Bagaimana Cara Kerjanya
Untuk mendapatkan nilai maksimal dari pembelajaran mesin, Anda harus tahu cara memasangkan algoritme terbaik dengan alat dan proses yang tepat. SAS menggabungkan warisan yang kaya dan canggih dalam statistik dan penambangan data dengan kemajuan arsitektur baru untuk memastikan model Anda berjalan secepat mungkin – bahkan di lingkungan perusahaan besar.
Algoritme: Antarmuka pengguna grafis SAS membantu Anda membangun model pembelajaran mesin dan menerapkan proses pembelajaran mesin berulang. Anda tidak harus menjadi seorang ahli statistik yang canggih. Pilihan lengkap algoritme pembelajaran mesin kami dapat membantu Anda dengan cepat mendapatkan nilai dari big data Anda dan disertakan dalam banyak produk SAS. Algoritme pembelajaran mesin SAS meliputi:
Jaringan neural
| |
Pohon keputusan
| |
Random forest
| |
Asosiasi dan penemuan urutan
| |
Peningkatan dan pengantongan gradien
| |
Mesin vektor pendukung | |
Pemetaan tetangga terdekat | |
Penggugusan k-means | |
Peta pengelolaan mandiri |
Teknis optimasi pencarian lokal (mis, algoritme genetik)
| |
Maksimalisasi ekspektasi
| |
Spline regresi adaptif multivariasi
| |
Jaringan Bayesian
| |
Kernel density estimation
| |
Analisis komponen utama | |
Dekomposisi nilai tunggal | |
Model campuran Gaussian | |
Pembuatan aturan pencakupan berurutan |
Alat dan Proses: Seperti yang kita ketahui sekarang, ini bukan hanya algoritme. Pada akhirnya, rahasia untuk mendapatkan nilai paling banyak dari big data Anda terletak pada pasangan algoritme terbaik untuk tugas yang ditangani dengan:
Manajemen dan kualitas data yang menyeluruh
| |
GUI untuk membangun model dan aliran proses
| |
Eksplorasi data interaktif dan visualisasi hasil model
| |
Perbandingan berbagai model pembelajaran mesin untuk mengidentifikasi yang terbaik dengan cepat
|
Evaluasi model ansambel yang diautomasi untuk mengidentifikasi para pelaku terbaik
| |
Penyebaran model yang mudah sehingga Anda bisa mendapatkan hasil yang dapat diulang dan dapat diandalkan dengan cepat
| |
Sebuah platform terintegrasi, end-to-end untuk automasi proses data-ke-keputusan
|
Apa Anda membutuhkan beberapa panduan dasar tentang algoritme pembelajaran mesin mana dan digunakan untuk apa? Blog oleh Hui Li, seorang ilmuwan data di SAS ini menyediakan lembar contekan yang praktis.
Baca selengkapnya tentang topik ini
- What are chatbots?Chatbots are a form of conversational AI designed to simplify human interaction with computers. Learn how chatbots are used in business and how they can be incorporated into analytics applications.
- Analytics leads to lifesaving cancer therapiesA long-shot treatment offers hope to 10-year-old Harrison after he learns the DNA profile of his cancer is resistant to chemo. Find out how data and analytics play a role in cancer research and cancer treatments that are saving lives.
- Analytics tackles the scourge of human traffickingVictims of human trafficking are all around us. From forced labor to sex work, modern-day slavery thrives in the shadows. Learn why organizations are turning to AI and big data analytics to unveil these crimes and change future trajectories.
- Viking transforms its analytics strategy using SAS® Viya® on AzureViking is going all-in on cloud-based analytics to stay competitive and meet customer needs. The retailer's digital transformation are designed to optimize processes and boost customer loyalty and revenue across channels.