電腦視覺
何謂資料科學? 為何資料科學如此重要?
計算機視覺的歷史
計算機視覺的早期實驗發生在 1950 年代,使用一些第一個神經網絡來檢測物體的邊緣,並將簡單的物件分類為圓形和正方形等類別1970 年代,電腦視覺第一次商業用途使用光學字符識別解譯打字或手寫文字。 這項進步用於解釋盲人的書面文本。
隨著互聯網在 1990 年代成熟,使大量圖像在線可供分析,面部識別程序蓬勃發展。 這些不斷增長的資料集有助於讓機器在照片和影片中識別特定人物。
如今,許多因素已融合,帶來計算機視覺的復興:
這些進步對計算機視野的影響非常令人驚訝。 在不到十年內,物件識別和分類的準確率已從 50% 提高到 99%,而當今的系統在快速檢測和對視覺輸入的反應方面比人類更準確。
電腦視覺類似於拼圖
計算機將視覺圖像組裝與拼圖拼圖相同的方式來組裝視覺圖像。
想想您如何處理拼圖遊戲。 您擁有所有這些零件,您需要將它們組裝成一個圖像。 這就是計算機視覺的神經網絡的工作方式。 它們可以區分許多不同的影像片段,識別邊緣,然後對子元件進行模型。 使用過濾和通過深層網絡圖層進行一系列動作,它們可以將圖像的所有部分組成在一起,就像您使用拼圖一樣。
電腦並沒有在拼圖盒頂部提供最終圖像,但通常會給數百或數千個相關圖像,以訓練它識別特定對象。
程序員不是訓練電腦尋找鬍鬚、尾巴和尖銳的耳朵來識別貓,而是上傳數百萬張貓的照片,然後模型自己學會構成貓的不同特徵。
當今世界中的計算機視覺
從識別臉部到處理足球比賽的實時動作,計算機視覺在許多領域競爭並超越人類的視覺能力。
誰在使用計算機視覺?
計算機視覺在各行業中使用,以增強消費者體驗,降低成本並提高安全性。
政府
公共部門機構使用電腦視覺來更好地了解其控制下的資產的物理狀況,包括設備和基礎設施。 計算機視覺可以通過分析設備和基礎設施圖像來幫助機構執行預測性維護,以便對其中哪些需要維護做出更好的決定。 此外,公共部門機構使用計算機視覺來幫助監控遵守政策和法規。 例如,電腦視覺可用於偵測貨物中的違禁品、標誌建築物的潛在安全違規、檢查標籤是否遵守指引,並確保遵守保育法規。 最後,隨著無人機的使用越來越多的國防和國土安全需求,使用分析來識別和分析視覺摘要中的關鍵元素將成為公共部門的計算機視覺使用案例的前線。
醫療保健
在醫學領域,計算機視覺系統徹底檢查來自 MRI、CAT 掃描和 X 射線的圖像,以便像人類醫生一樣準確地檢測異常。 醫療專業人員還在超聲波等三維圖像上使用神經網絡來檢測心跳中的視覺差異等。
用於動物保護的計算機視覺
了解專為分析動物軌跡而設計的計算機視覺模型如何運作。 是否可以訓練計算機看到像本地動物追踪器一樣看到足跡? 查看電腦如何處理不同資訊層,以確定動物及其性別。 在這部影片中,SAS 進階分析 R & D 高級經理賈雷德·彼得森 (Jared Peterson) 展示了神經網路如何成為電腦視覺背後的科學。
計算機視覺的工作原理
計算機視覺通過三個基本步驟運作:
取得影像
影像,甚至是大型集合,可以通過影片,照片或 3D 技術實時獲取進行分析。
處理影像
深度學習模型將大部分程序自動化,但模型通常通常會通過先給數千個標籤或預先識別的圖像來訓練模型。
了解圖像
最後一步是解釋步驟,其中物件被識別或分類。
現今的 AI 系統可以進一步,並根據對圖像的理解採取行動。 有許多類型的計算機視覺用於不同的方式:
- 影像分割將影像分割成多個區域或片段,以單獨檢查。
- 物件偵測可識別影像中的特定物件。高級物體檢測可識別單個圖像中的許多物體:足球場、進攻球員、防守球員、球等。這些模型使用 X、Y 座標來建立邊界框並識別框內的所有內容。
- 面部識別是一種先進的物體檢測類型,不僅可識別圖像中的人臉,還可以識別特定個人。
- 邊緣偵測是一種技術,用於識別物件或風景的外側邊緣,以更好地識別影像中的內容。
- 圖案檢測是識別圖像中重複的形狀,顏色和其他視覺指標的過程。
- 影像分類將影像分組成不同的類別。
- 特徵匹配是一種模式偵測類型,可匹配影像中的相似之處,以協助對其進行分類。
簡單的計算機視覺應用可能只使用這些技術之一,但更先進的用途,例如自動駕駛汽車的計算機視覺,依賴多種技術來實現其目標。
電腦視覺特色產品
SAS® Visual Data Mining and Machine Learning
除了深度學習之外,此 SAS 解決方案還支持叢集,不同風格的回歸、隨機樹系、漸變增強模型、支持向量機器、情感分析等。 互動式的視覺化管道環境將每個專案 (或目標) 呈現為一系列按邏輯順序發生的顏色編碼步驟。
推薦閱讀
- 文章 Analytics leads to lifesaving cancer therapiesA long-shot treatment offers hope to 10-year-old Harrison after he learns the DNA profile of his cancer is resistant to chemo. Find out how data and analytics play a role in cancer research and cancer treatments that are saving lives.
- 文章 The untapped potential in unstructured textText is the largest human-generated data source. It grows every day as we post on social media, interact with chatbots and digital assistants, send emails, conduct business online, generate reports and essentially document our daily thoughts and activities using computers and mobile devices.
- 文章 台灣製造業再戰 10 年新標配:AIoT 如何助力工廠從自動化邁向智慧化