Your browser is out of date. It may not display all features of this websites. Learn how to update your browser.

OK
立即配置您的視覺系統 Webshop

深度學習是什麼?

在愈來愈多領域中,我們會遇到像是機器學習、深度學習或人工智慧之類的名詞;這些名詞到底是什麼意思?實際應用在哪些地方?

在我們的影片《機器是如何學習的? 》中,我們會說明機器學習的基本知識,揭開機器如何透過神經網路而變得聰明。在這篇文章中,我們會深入探討個別領域,說明在這個主題中一些不斷重覆出現的不同技術名詞:深度學習是機器學習的一個子領域,而機器學習又是人工智慧的一個子領域。

1.人工智慧 (AI)

AI 通常被描述為由機器模仿或再現人類的行為結構,通常是個程式語言。一般泛稱的 AI 包括數個子領域,像是專家系統、型樣分析系統、或機器人。基於 AI 的系統使用多種方法來模仿或模型化人類行為與決策結構,例如統計演算法、啟發式程序、人造神經網路 (ANN),或其他機器學習變體。

2.機器學習

機器學習是 AI 的一個子領域,包括透過自動化程序,自一組樣本資料導出的通則;也就是說從樣本資料中「學習」規則。可以使用預先定義且可理解的演算法和規則來完成,或是如深度學習的場合,使用人造神經網路來進行。機器學習又分成監督式和非監督式學習。在監督式學習,用來學習的樣本資料同時包括對應的預期結果 (如分類),而在非監督式學習,系統會從輸入中自己辨識出可能的結果。

3.深度學習

深度學習是一種機器學習的方法,在此人造神經網路在會學習過程中獨自建構 (訓練) 中通則。特別是在機器視覺領域,神經網路通常以監督式學習訓練,亦即樣本資料以及其預先定義的結果來進行。

深度學習如何運作?

1.人造神經網路

深度學習是一種運用特定形式人造神經網路 (ANN) 的方法,而 ANN 須先以樣本資料進行訓練。訓練過後的 ANN 即可用於其工作上。使用訓練過的 ANN 即稱為「推理」。在推理時,ANN 根據學得的規則,對供給的資料回報其處理結果。舉例來說,可以用來推估輸入的影像代表的是不良品或沒問題的良品。

2.神經元、層次與連結

ANN 含有多層互相連接的「神經元」。在最簡單的案例,會有一個輸入層和一個輸出層。神經元和連結可以視為矩陣。一個連結矩陣包含輸入矩陣的每個值,連結到結果矩陣的值。連結矩陣的值,包括對應連結的權重。輸入值的權重和邏輯矩陣的值,產生結果矩陣中的對應值。

3.深度人造神經網路

深度學習一詞描述所謂「深度」ANN 的訓練。除了輸入和輸出層外,在可見的輸入輸出層之間,還有數百個「隱藏」層」。一個隱藏層的結果矩陣,用作為下一層的輸入矩陣。在這個案例中,只有最後一層的輸出矩陣,才包含結果。

4.訓練

訓練 ANN 時,最初是隨機設定焦點的。之後逐步加上樣本資料。根據輸入資料與預期結果,使用一個學習規則來調整關係權重。ANN 最後的工作結果優劣,表示結果中評估的準確性,和訓練時的樣本資料有很深的關係。在訓練中使用大量樣本資料,且內容高度變異,通常推理的結果也更精確。如果使用許多相似且重複性高的資料,ANN 在遇到和樣本資料不同的情形時,就無法估算該領域的資料。這種情形,我們會稱對 ANN「過度適配」。

深度學習可以幫我做什麼?

不論餅乾是大是小,大家都愛吃。以餅乾當例子,可以解釋深度學習的運作方式。深度學習的應用領域非常多樣化。特別在機器視覺領域,深度學習廣泛用於各種類型工作。深度學習最常見的工作,大概就是影像分析,用於分類與影像資料分割。

1.影像分類

在影像分類中,影像會分配到不同的類別,例如,將有缺陷的組件和無缺陷的組件相互區分開來,並根據缺陷的不同類型來進行排序,或者將空出的影像 (vacation images) 分為不同類別。以餅乾生產過程為例,可以用來檢查所有餅乾是否都完好無缺,還是已經破損。

2.影像分割與物體辨識

影像分割會將影像的每一畫素都指定一個類別。這樣即可在同一張影像中辨識出多個不同物體,例如在購物籃中辨識出不同水果,或是在路上辨識交通號誌、道路和行人。舉例來說,影像分割也能讓我們看見同一條生產線上跑過的不同形狀餅乾:圓的、方的、六角型的。

3.影像處理

深度學習也可以用於處理並最佳化影像資料,例如,自影像中去除干擾雜訊,或補償光學鏡頭引起的干擾。

Back to Webshop