Uczenie maszynowe

Teoria i praktyka

Uczenie maszynowe to metoda analizy danych, która automatyzuje tworzenie modeli analitycznych. Jest to gałąź sztucznej inteligencji oparta na założeniu, że systemy mogą uczyć się na podstawie danych, identyfikować wzorce i podejmować decyzje przy minimalnej interwencji człowieka.

Ewolucja uczenia maszynowego

Ze względu na nowe technologie obliczeniowe, dzisiejsze uczenie maszynowe nie przypomina uczenia maszynowego z przeszłości. Wywodzi się z rozpoznawania wzorców i teorii, że komputery mogą się uczyć bez programowania do wykonywania określonych zadań; badacze zainteresowani sztuczną inteligencją chcieli sprawdzić, czy komputery mogą uczyć się na podstawie danych. Iteracyjny aspekt uczenia maszynowego jest ważny, ponieważ gdy modele są zasilane przez nowe dane, potrafią się samodzielnie dostosowywać. Uczą się na podstawie poprzednich obliczeń, aby podejmować wiarygodne, powtarzalne decyzje i generować wyniki. To nauka, która nie jest nowa - ale nabrała ona nowego rozpędu.

Podczas gdy wiele algorytmów uczenia maszynowego istnieje już od dłuższego czasu, zdolność do automatycznego stosowania złożonych obliczeń matematycznych na dużych zbiorach danych - w kółko, coraz szybciej i szybciej - jest najnowszym osiągnięciem. Oto kilka szeroko nagłośnionych przykładów zastosowań uczenia maszynowego, które mogą być znane:

  • Mocno reklamowany, autonomiczny samochód Google? Istota uczenia maszynowego.
  • Oferty rekomendacji online, takie jak te na platformach Amazon i Netflix? Aplikacje uczenia maszynowego w codziennym życiu.
  • Wiedza o tym, co klienci mówią o Tobie w mediach społecznościowych? Uczenie maszynowe połączone z tworzeniem reguł językowych.
  • Zapobieganie oszustwom i ich wykrywanie? Jedno z bardziej oczywistych i ważnych zastosowań w dzisiejszym świecie.

 

Uczenie maszynowe i sztuczna inteligencja

Podczas gdy sztuczna inteligencja (AI) to szeroka nauka o naśladowaniu ludzkich zdolności, uczenie maszynowe to specyficzny podzbiór AI, który uczy maszynę, jak się uczyć. Obejrzyj ten film, aby lepiej zrozumieć związek między sztuczną inteligencją a uczeniem maszynowym. Zobaczysz, jak działają te dwie technologie, z przydatnymi przykładami i kilkoma zabawnymi dodatkami.

Dlaczego uczenie maszynowe jest ważne?

Odradzające się zainteresowanie uczeniem maszynowym wynika z tych samych czynników, które sprawiły, że eksploracja danych i analiza bayesowska stały się bardziej popularne niż kiedykolwiek wcześniej. Rzeczy takie jak rosnąca ilość i różnorodność dostępnych danych, wzrost mocy obliczeniowej, która jest tańsza i bardziej wydajna, tańsze przechowywanie danych.

Wszystko to oznacza, że możliwe jest szybkie i automatyczne tworzenie modeli, które mogą analizować większe, bardziej złożone dane i dostarczać szybsze, dokładniejsze wyniki - nawet na bardzo dużą skalę. Budując precyzyjne modele, organizacja ma większą szansę na zidentyfikowanie zyskownych możliwości - lub uniknięcie nieznanych zagrożeń.

 

Co jest potrzebne do stworzenia dobrego systemu uczenia maszynowego?

  • Umiejętność przygotowania danych.
  • Algorytmy - podstawowe i zaawansowane.
  • Automatyzacja i procesy iteracyjne.
  • Skalowalność.
  • Modelowanie zespołowe.
Infografika dotycząca uczenia maszynowego

Czy wiesz, że?

  • W uczeniu maszynowym cel nazywany jest etykietą.
  • W statystyce cel nazywany jest zmienną zależną.
  • Zmienna w statystyce nazywana jest cechą w uczeniu maszynowym.
  • Transformacja w statystyce nazywana jest tworzeniem cech w uczeniu maszynowym.

Uczenie maszynowe w dzisiejszym świecie

Wykorzystując algorytmy do tworzenia modeli, które odkrywają powiązania, organizacje mogą podejmować lepsze decyzje bez interwencji człowieka. Dowiedz się więcej o technologiach, które kształtują świat, w którym żyjemy.

Blog

Wszystko o algorytmach uczenia maszynowego

Istnieją cztery rodzaje algorytmów uczenia maszynowego: nadzorowane, pół-nadzorowane, nienadzorowane i wzmocnione. Dowiedz się, jak one działają i która z nich najlepiej zaspokoi Twoje potrzeby biznesowe.

Przeczytaj artykuł

Rozwijaj kompetencje SAS

Uzyskaj szczegółowe instrukcje i bezpłatny dostęp do oprogramowania SAS, aby rozwinąć swoje umiejętności w zakresie uczenia maszynowego. Kursy obejmują: 14 godzin kursu, 90 dni darmowego dostępu do oprogramowania w chmurze oraz elastyczny format e-learningu, bez konieczności posiadania umiejętności programowania. 

Kursy uczenia maszynowego

Uczenie maszynowe - teoria i praktyka

Poznaj podstawy uczenia maszynowego oraz czynniki, które należy wziąć pod uwagę, planując wykorzystanie tej technologii w konkretnych zastosowaniach biznesowych.






Obejrzyj webinarium

6 pułapek uczenia maszynowego

Leżące u podstaw niewłaściwe założenia mogą prowadzić do złych wyborów i błędów, zwłaszcza w przypadku zaawansowanych metod, takich jak uczenie maszynowe. Pomiń błędy innych, korzystając z porad eksperta ds. uczenia maszynowego.

Przeczytaj artykuł na blogu

Kto go używa?

Większość branż pracujących z dużymi ilościami danych doceniła wartość technologii uczenia maszynowego. Zbierając spostrzeżenia z tych danych - często w czasie rzeczywistym - organizacje są w stanie pracować wydajniej lub zyskać przewagę nad konkurencją.

Usługi finansowe

Banki i inne firmy z branży finansowej wykorzystują technologię uczenia maszynowego do dwóch kluczowych celów: do identyfikowania ważnych spostrzeżeń w danych oraz do zapobiegania oszustwom i ich wykrywania. Spostrzeżenia mogą identyfikować okazje inwestycyjne lub pomagać inwestorom optymalizować działania sprzedażowe. Eksploracja danych może również identyfikować klientów o profilach wysokiego ryzyka lub wykorzystywać cyberinwigilację do wykrywania oszustw.

Sektor publiczny

Agencje rządowe, takie jak bezpieczeństwo publiczne i przedsiębiorstwa użyteczności publicznej, mają szczególne zapotrzebowanie na uczenie maszynowe, ponieważ mają wiele źródeł danych, które można wydobywać w celu uzyskania wglądu. Na przykład analiza danych z czujników pozwala zidentyfikować sposoby na zwiększenie wydajności i zaoszczędzenie pieniędzy. Uczenie maszynowe może również pomóc w wykrywaniu oszustw i minimalizowaniu kradzieży tożsamości.

Ochrona zdrowia

Uczenie maszynowe jest szybko rozwijającym się trendem w branży opieki zdrowotnej, dzięki pojawieniu się urządzeń wyposażonych w czujniki, które mogą wykorzystywać dane do oceny stanu zdrowia pacjenta w czasie rzeczywistym. Technologia ta może również pomóc ekspertom medycznym w analizie danych w celu zidentyfikowania trendów lub sygnałów ostrzegawczych, które mogą prowadzić do poprawy diagnozy i leczenia. 

Sprzedaż detaliczna

Strony internetowe polecające przedmioty, które mogą Ci się spodobać na podstawie poprzednich zakupów, wykorzystują uczenie maszynowe do analizy Twojej historii zakupów.  Sprzedawcy detaliczni polegają na uczeniu maszynowym w celu przechwytywania danych, analizowania ich i wykorzystywania do personalizowania doświadczeń zakupowych, wdrażania kampanii marketingowych, optymalizacji cen, planowania towarów i wglądu w klientów.   

Ropa i gaz

Znalezienie nowych źródeł energii. Analiza minerałów w ziemi. Przewidywanie awarii czujników rafineryjnych. Usprawnienie dystrybucji oleju w celu zwiększenia jej wydajności i opłacalności. Liczba przypadków użycia uczenia maszynowego w tej branży jest ogromna - i wciąż rośnie.

Transport

Analiza danych w celu identyfikacji wzorców i trendów jest kluczowa dla branży transportowej, która polega na zwiększaniu wydajności tras i przewidywaniu potencjalnych problemów w celu zwiększenia rentowności. Aspekty analizy danych i modelowania uczenia maszynowego są ważnymi narzędziami dla firm dostawczych, transportu publicznego i innych organizacji transportowych.

Jak to działa

Aby uzyskać największą wartość z uczenia maszynowego, trzeba wiedzieć, jak połączyć najlepsze algorytmy z odpowiednimi narzędziami i procesami. SAS łączy bogate doświadczenie w dziedzinie statystyki i eksploracji danych z nowymi osiągnięciami architektonicznymi, aby zapewnić jak najszybsze działanie modeli - w dużych środowiskach korporacyjnych lub w środowisku chmury obliczeniowej.

Algorytmy: Graficzne interfejsy użytkownika SAS pomagają budować modele uczenia maszynowego i wdrażać iteracyjny proces uczenia maszynowego. Nie musisz być zaawansowanym statystykiem. Nasz kompleksowy wybór algorytmów uczenia maszynowego jest zawarty w wielu produktach SAS i może pomóc w szybkim uzyskaniu wartości z dużych zbiorów danych - w tym danych z Internetu rzeczy. Algorytmy uczenia maszynowego SAS obejmują:

Sieci neuronowe
 
Drzewa decyzyjne
 
Lasy losowe
 
Skojarzenia i odkrywanie sekwencji
 
Wzmocnienie gradientu i bagging
 
Maszyny wektorów nośnych
 
Mapowanie najbliższych sąsiadów
 
Klastrowanie k-średnich
 
Samoorganizujące się mapy
 
Lokalne techniki optymalizacji (np. algorytmy genetyczne)
 
Maksymalizacja oczekiwań
 
Wielowymiarowa adaptacyjna regresja splajnowa
 
Sieci bayesowskie
 
Estymacja gęstości jądra
 
Analiza składowych głównych
 
Dekompozycja wartości pojedynczej
 
Modele mieszanki gaussowskiej
 
Sekwencyjne tworzenie reguł pokrycia
 

 

Narzędzia i procesy: Jak już wiemy, nie chodzi tylko o algorytmy. Ostatecznie sekret uzyskania największej wartości z dużych zbiorów danych polega na wykorzystaniu najlepszych algorytmów do danego zadania:

Kompleksowa jakość danych i zarządzanie nimi
 
Interfejsy GUI do tworzenia modeli i przepływów procesów
 
Interaktywna eksploracja danych i wizualizacja wyników modelu
 
Porównanie różnych modeli uczenia maszynowego w celu szybkiej identyfikacji najlepszego z nich    
 
Zautomatyzowana ocena modelu ensemble w celu zidentyfikowania najlepszych wyników
 
Łatwe wdrażanie modeli pozwala szybko uzyskać powtarzalne i wiarygodne wyniki.
 
Zintegrowana, kompleksowa platforma do automatyzacji procesu od danych do decyzji
 

Jakie są popularne metody uczenia maszynowego?

Dwie z najczęściej stosowanych metod uczenia maszynowego to uczenie nadzorowane i uczenie bez nadzoru - ale istnieją również inne metody uczenia maszynowego. Oto przegląd najpopularniejszych typów.

Algorytmy uczenia nadzorowanego są trenowane przy użyciu oznaczonych przykładów, takich jak dane wejściowe, w których znane jest pożądane wyjście. Na przykład, urządzenie może mieć punkty danych oznaczone jako "F" (failed) lub "R" (runs). Algorytm uczący się otrzymuje zestaw danych wejściowych wraz z odpowiadającymi im prawidłowymi danymi wyjściowymi, a algorytm uczy się, porównując swoje rzeczywiste dane wyjściowe z prawidłowymi danymi wyjściowymi w celu znalezienia błędów. Następnie odpowiednio modyfikuje model. Dzięki metodom takim jak klasyfikacja, regresja, przewidywanie i wzmacnianie gradientowe, uczenie nadzorowane wykorzystuje wzorce do przewidywania wartości etykiety na dodatkowych nieoznakowanych danych. Uczenie nadzorowane jest powszechnie stosowane w aplikacjach, w których dane historyczne przewidują prawdopodobne przyszłe zdarzenia. Na przykład może przewidzieć, kiedy transakcje kartą kredytową mogą być nieuczciwe lub który klient ubezpieczeniowy prawdopodobnie złoży roszczenie.

Uczenie nienadzorowane jest wykorzystywane w odniesieniu do danych, które nie mają historycznych etykiet. System nie podaje "prawidłowej odpowiedzi." Algorytm musi dowiedzieć się, co jest wyświetlane. Celem jest zbadanie danych i znalezienie w nich struktury. Uczenie bez nadzoru działa dobrze na danych transakcyjnych. Może na przykład identyfikować segmenty klientów o podobnych cechach, którzy mogą być następnie traktowani podobnie w kampaniach marketingowych. Może też znaleźć główne atrybuty, które oddzielają segmenty klientów od siebie. Popularne techniki obejmują samoorganizujące się mapy, mapowanie najbliższych sąsiadów, grupowanie k-średnich i dekompozycję wartości pojedynczej. Algorytmy te są również wykorzystywane do segmentacji tematów tekstowych, rekomendowania elementów i identyfikowania wartości odstających.

Uczenie półnadzorowane jest wykorzystywane do tych samych zastosowań, co uczenie nadzorowane. Wykorzystuje on jednak zarówno oznaczone, jak i nieoznaczone dane do szkolenia - zazwyczaj niewielką ilość oznaczonych danych z dużą ilością nieoznaczonych danych (ponieważ nieoznaczone dane są tańsze i ich pozyskanie wymaga mniej wysiłku). Ten rodzaj uczenia się może być wykorzystywany z metodami takimi jak klasyfikacja, regresja i przewidywanie. Uczenie pół-nadzorowane jest przydatne, gdy koszt związany z etykietowaniem jest zbyt wysoki, aby umożliwić w pełni etykietowany proces uczenia. Wczesne przykłady zastosowań obejmują identyfikację twarzy osoby na kamerze internetowej.

Uczenie ze wzmocnieniem jest często wykorzystywane w robotyce, grach i nawigacji. Jest również używane w połączeniu z technikami generatywnej sztucznej inteligencji, takimi jak duże modele językowe. Dzięki uczeniu ze wzmocnieniem algorytm odkrywa metodą prób i błędów, które działania przynoszą największe korzyści. Ten rodzaj uczenia się ma trzy podstawowe elementy: agenta (uczącego się lub podejmującego decyzje), środowisko (wszystko, z czym agent wchodzi w interakcję) i działania (to, co agent może zrobić). Celem jest, aby agent wybrał działania, które maksymalizują oczekiwaną nagrodę w danym czasie. Agent osiągnie cel znacznie szybciej, stosując dobrą metodę. Celem uczenia ze wzmocnieniem jest więc nauczenie się najlepszej metody.

Ludzie mogą zazwyczaj stworzyć jeden lub dwa dobre modele tygodniowo; uczenie maszynowe może tworzyć ich tysiące.

Thomas H. Davenport, ekspert w dziedzinie analityki fragment artykułu z The Wall Street Journal

Jakie są różnice między eksploracją danych, uczeniem maszynowym i uczeniem głębokim?

Chociaż wszystkie te metody mają ten sam cel - wyodrębnienie spostrzeżeń, wzorców i relacji, które można wykorzystać do podejmowania decyzji - mają różne podejścia i możliwości.

Eksploracja danych

Eksploracja danych może być uważana za superset wielu różnych metod wydobywania informacji z danych. Może to obejmować tradycyjne metody statystyczne i uczenie maszynowe. Eksploracja danych wykorzystuje metody z wielu różnych dziedzin do identyfikowania nieznanych wcześniej wzorców z danych. Może to obejmować algorytmy statystyczne, uczenie maszynowe, analizę tekstu, analizę szeregów czasowych i inne obszary analityki. Eksploracja danych obejmuje również badanie i praktykę przechowywania danych i manipulowania nimi.

 


Uczenie maszynowe

Główną różnicą w uczeniu maszynowym jest to, że podobnie jak w przypadku modeli statystycznych, celem jest zrozumienie struktury danych - dopasowanie teoretycznych rozkładów do danych, które są dobrze rozumiane. Tak więc w przypadku modeli statystycznych istnieje teoria stojąca za modelem, która jest matematycznie udowodniona, ale wymaga to również, aby dane spełniały pewne silne założenia. Uczenie maszynowe rozwinęło się w oparciu o możliwość wykorzystania komputerów do badania danych pod kątem struktury, nawet jeśli nie mamy teorii na temat tego, jak ta struktura wygląda. Testem dla modelu uczenia maszynowego jest błąd walidacji na nowych danych, a nie test teoretyczny, który udowadnia hipotezę zerową. Ponieważ uczenie maszynowe często wykorzystuje iteracyjne podejście do uczenia się z danych, uczenie można łatwo zautomatyzować. Przejścia są wykonywane przez dane do momentu znalezienia solidnego wzorca.


Uczenie głębokie

Uczenie głębokie wykorzystuje postępy w mocy obliczeniowej i specjalnych typach sieci neuronowych, aby uczyć się skomplikowanych wzorców na dużych zbiorach danych. Techniki uczenia głębokiego są obecnie najnowocześniejsze w identyfikacji obiektów na obrazach i słów w dźwiękach. Naukowcy starają się teraz wykorzystać te osiągnięcia w rozpoznawaniu wzorców do bardziej złożonych zadań, takich jak automatyczne tłumaczenie języka, diagnozy medyczne i rozwiązania wielu innych ważnych problemów społecznych i biznesowych.