Visi Komputer
Apa itu dan mengapa hal itu penting
Visi komputer adalah bidang kecerdasan buatan yang melatih komputer menafsirkan dan memahami dunia visual. Menggunakan gambar digital dari kamera dan video serta model pembelajaran mendalam, mesin-mesin dapat dengan akurat mengidentifikasi dan mengklasifikasikan objek — kemudian bereaksi terhadap apa yang “dilihatnya.”
Sejarah visi komputer
Percobaan awal dalam visi komputer terjadi di tahun 1950-an, menggunakan beberapa jaringan neural pertama untuk mendeteksi tepi suatu objek dan memilah objek sederhana ke dalam kategori seperti lingkaran dan kotak. Pada tahun 1970-an, penggunaan komersial pertama visi komputer menafsirkan teks yang diketik atau tulisan tangan menggunakan pengenalan karakter optik. Kemajuan ini digunakan untuk menafsirkan teks tertulis untuk tunanetra.
Saat internet semakin matang pada tahun 1990-an, membuat sekumpulan besar gambar tersedia secara online untuk analisis, program pengenalan wajah berkembang. Set data yang berkembang ini membantu mesin untuk mengidentifikasi orang-orang tertentu di foto dan video.
Saat ini, sejumlah faktor telah menyatu untuk membawa kebangkitan kembali dalam visi komputer:
Teknologi seluler dengan kamera tertanam telah memenuhi dunia dengan foto dan video
Daya komputasi telah menjadi lebih terjangkau dan mudah diakses.
Perangkat keras yang dirancang untuk visi dan analisis komputer lebih banyak tersedia.
Algoritme baru seperti jaringan neural konvolusional dapat memanfaatkan kemampuan perangkat keras dan perangkat lunak.
Efek dari kemajuan di bidang visi komputer ini sangat mencengangkan. Tingkat akurasi untuk identifikasi dan klasifikasi objek telah berubah dari 50 persen menjadi 99 persen dalam waktu kurang dari satu dekade — dan sistem saat ini lebih akurat daripada manusia dalam mendeteksi dan bereaksi lebih cepat terhadap input visual.
Visi komputer menyerupai teka-teki jigsaw
Komputer mengumpulkan gambar visual dengan cara yang sama seperti Anda dapat menyusun teka-teki jigsaw.
Pikirkan tentang cara pendekatan Anda terhadap teka-teki jigsaw. Anda punya semua potongannya, dan Anda harus menyusunnya menjadi sebuah gambar. Begitulah cara jaringan neural untuk visi komputer bekerja. Jaringan tersebut membedakan banyak bagian gambar yang berbeda, mengidentifikasi ujung-ujungnya dan kemudian memodelkan subkomponen. Menggunakan pemfilteran dan serangkaian tindakan melalui berbagai lapisan jaringan mendalam, jaringan dapat menyusun semua bagian gambar bersama, sangat mirip dengan yang Anda lakukan dengan teka-teki.
Komputer tidak diberikan gambar akhir pada bagian teratas teka-tekinya — namun seringkali diberi masukan ratusan atau ribuan gambar untuk melatihnya mengenali objek-objek khusus.
Alih-alih melatih komputer untuk mencari kumis, ekor dan telinga yang runcing untuk mengenali seekor kucing, programmer mengunggah jutaan foto kucing, kemudian model belajar sendiri tentang berbagai fitur yang membentuk kucing.
Visi komputer di dunia saat ini
Untuk mengenali wajah guna memproses tindakan nyata permainan sepak bola, visi komputer bersaing dan melampaui kemampuan visual manusia di banyak area.
Pembelajaran mendalam dan visi komputer
Bagaimana pembelajaran mendalam melatih komputer untuk melihat? Pelajari bagaimana berbagai jenis jaringan neural bekerja dan bagaimana jaringan tersebut digunakan untuk visi komputer.
Analisis gambar dan AI
Lihat pengantar analisis gambar dan pelajari teknik analitis yang dapat Anda terapkan pada data gambar.
Demo pengenalan wajah
Pelajari teknik yang mendasar dan langkah pemrosesan data yang diperlukan untuk pengenalan wajah dan visi komputer. Demo menunjukkan bagaimana model SAS® Viya® mendeteksi, menyelaraskan, mewakili, dan mengklasifikasikan gambar wajah.
Siapa yang menggunakan visi komputer?
Visi komputer digunakan di seluruh industri guna meningkatkan pengalaman konsumen, mengurangi biaya dan meningkatkan keamanan.
Manufaktur
Dalam manufaktur, bisnis menggunakan visi komputer untuk mengidentifikasi kerusakan produk dalam waktu nyata. Karena produk tersebut berasal dari jalur produksi, komputer memproses gambar atau video, dan menandai lusinan berbagai jenis cacat — bahkan pada produk terkecil sekalipun.
Perawatan Kesehatan
Di bidang medis, sistem visi komputer secara menyeluruh memeriksa citra dari pemindaian MRI, CAT, dan sinar X untuk mendeteksi kelainan seakurat dokter manusia. Para profesional medis juga menggunakan jaringan saraf pada gambar tiga dimensi seperti ultrasound untuk mendeteksi perbedaan visual dalam detak jantung dan banyak lagi.
Asuransi
Di industri asuransi, perusahaan menggunakan visi komputer untuk melakukan penilaian kerusakan kendaraan dengan lebih konsisten dan akurat. Peningkatan ini mengurangi penipuan dan merampingkan proses klaim.
Pertahanan dan Keamanan
Di lingkungan berkeamanan tinggi sepeti perbankan dan kasino, perusahaan menggunakan visi komputer untuk identifikasi pelanggan dengan lebih akurat saat sejumlah besar uang sedang dipertukarkan. Tidak mungkin bagi penjaga keamanan untuk menganalisis ratusan umpan video sekaligus, tetapi algoritme visi komputer dapat melakukannya.
Pelajari Selengkapnya Tentang Industri yang Menggunakan Teknologi Ini
- Automotive
- Banking
- Capital Markets
- Casinos
- Communications
- Consumer Goods
- Defense & Security
- Government
- Health Care
- Health Insurance
- High-Tech Manufacturing
- Higher Education
- Hotels
- Insurance
- Life Sciences
- Manufacturing
- Media
- Midsize Business
- Oil & Gas
- P-12 Education
- Retail Analytics
- Sports Analytics
- Travel & Transportation
- Utilities
Visi komputer adalah salah satu hal paling luar biasa yang dihasilkan dari dunia pembelajaran mendalam dan kecerdasan buatan. Kemajuan pembelajaran mendalam telah berkontribusi ke bidang visi komputer hingga benar-benar telah membuat bidang ini terpisah. Wayne Thompson SAS Data Scientist
Visi komputer untuk konservasi hewan
Pelajari bagaimana model visi komputer dirancang untuk menganalisis kerja penelusuran hewan. Dapatkah komputer dilatih untuk melihat jejak seperti pelacak hewan? Lihat bagaimana komputer memproses berbagai lapisan informasi untuk menentukan hewan dan jenis kelaminnya. Di video ini, Jared Peterson, Senior Manager SAS Advanced Analytics R&D, memperlihatkan bagaimana jaringan neural menjadi sains di balik visi komputer.
Cara visi komputer bekerja
Visi komputer bekerja dalam tiga langkah dasar:
Memperoleh gambar
Gambar-gambar, bahkan dalam jumlah besar, dapat diperoleh secara waktu nyata melalui video, foto atau teknologi 3D untuk analisis.
Memproses gambar
Model pembelajaran mendalam mengautomasi sebagian besar proses ini, tetapi model sering dilatih dengan terlebih dahulu diberi ribuan gambar yang diberi label atau diidentifikasi sebelumnya.
Memahami gambar
Langkah akhir ini adalah langkah interpretatif, dengan suatu objek diidentifikasi atau diklasifikasikan.
Sistem-sistem AI saat ini dapat melangkah lebih jauh dan mengambil tindakan berdasarkan pemahaman tentang gambar. Ada banyak jenis visi komputer yang digunakan dalam berbagai cara:
- Segmentasi gambar mempartisi gambar ke dalam beberapa wilayah atau bagian untuk diperiksa secara terpisah.
- Deteksi objek mengidentifikasi objek khusus dalam sebuah gambar. Deteksi objek tingkat lanjut mengenali berbagai objek dalam satu gambar: lapangan sepak bola, seorang pemain penyerang, pemain bertahan, sebuah bola, dan lain sebagainya. Model-model ini menggunakan koordinat X, Y untuk menciptakan kotak pembatas dan mengidentifikasi segalanya yang ada di dalam kotak.
- Pengenalan wajah adalah jenis deteksi objek canggih yang tidak hanya mengenali wajah manusia dalam gambar, tetapi mengidentifikasi individu tertentu.
- Deteksi tepian adalah teknik yang digunakan untuk mengidentifikasi tepi luar suatu objek atau lanskap untuk mengidentifikasi dengan lebih baik apa yang ada di dalam gambar.
- Deteksi pola adalah proses mengenali bentuk, warna, dan indikator visual berulang lainnya dalam gambar.
- Klasifikasi gambar mengelompokkan gambar-gambar ke dalam berbagai kategori.
- Pencocokan fitur adalah jenis deteksi pola yang mencocokkan kemiripan dalam gambar-gambar untuk membantu mengklasifikasikannya.
Penerapan sederhana dari visi komputer hanya dapat menggunakan salah satu teknik ini, tetapi penggunaan yang lebih canggih, seperti visi komputer untuk mobil kendali otomatis, bergantung pada beberapa teknik untuk mencapai tujuannya.
Langkah berikutnya
Lihat bagaimana visi komputer memainkan peran dalam kecerdasan buatan.
Produk pilihan untuk visi komputer
SAS® Visual Data Mining and Machine Learning
Solusi SAS ini mendukung penggugusan, berbagai macam regresi, random forest, model peningkatan gradien, mesin vektor pendukung, analisis sentimen, dan masih banyak lagi, selain pembelajaran mendalam. Sebuah lingkungan saluran interaktif visual menyajikan setiap proyek (atau tujuan) sebagai serangkaian langkah-langkah kode warna yang terjadi dalam urutan logis.
Recommended reading
- Article The Humanity in Artificial IntelligenceCould artificial intelligence be the change agent we need to solve many problems around the globe? Read how AI could accelerate our ability to have a a positive, lasting impact.
- Article How AI and advanced analytics are impacting the financial services industryTop SAS experts weigh in on the topics that are keeping institutions up at night and fraudsters in a job.
- Article 3 steps for AI ethicsWill artificial intelligence benefit humanity or usher in a series of unintended consequences? AI ethics may be one way to ensure artificial intelligence is used for good.