屬於台灣人的AI入門書:《人工智慧在台灣》

Tsanyu Kuo
Jan 24, 2021

--

去年暑假的時候,因為準備外貿協會的招考,因為覺得人工智慧這個趨勢可能會出現在考題裡面,所以決定要找一本入門書來讀。在讀這本書之前,我只有學過基礎的Python、R跟Stata,在經濟相關的課堂上老師有帶我們跑過機器學習(Machine Learning)的程式,但是其實對於人工智慧的架構,人工智慧可以在產業界的應用,還是不太了解。

這本書的全名為《人工智慧在台灣:產業轉型的契機與挑戰》,是由台灣人工智慧學校(Taiwan AI Academy)執行長陳昇瑋所寫。很遺憾的是,陳昇瑋在書出版之後的一年後過世,這本書也就成為他送給台灣人工智慧領域最後的禮物。

本書一開始作者敘述自己如何踏入人工智慧領域,除了在學術界研究人工智慧,也積極接觸產業界,並建立台灣首個結合產官學的人工智慧社群,最後建立台灣人工智慧學校,把學術界的研究成果,結合到產業界,希望最終達成台灣「AI產業化,產業AI化」的目標。

根據訊息理論(Information Theory),要有變化才會有資訊,所以要做AI的第一步,其實是組織要鼓勵實驗精神,組織才會有多元的資料,可以去發展AI。因為AI是資料機器學習三者互動的結果,只有後面兩者是無法發展AI的。

書中另外引用Kauffman (1995)提出的「紅皇后效應」(Red Queen Effect),因為商業的動態競爭,組織必須更快的學習,才可以生存。但是隨著市場的淘汰機制也在加快,所以商業競爭的步調也隨之加快。因為競爭環境越來越激烈,所以產業比過去更需要導入AI相關的技術以維持競爭力。

三波人工智慧

  • 第一波(1950–1960)符號邏輯(Symbolic Logic):把人類的知識與思考放入電腦
  • 第二波(1980–1990)專家系統(Expert System):讓電腦照人類定義的規則做決策
  • 第三波(2010-)機器學習(Machine Learning):不事先給電腦規則,讓電腦由專家的歷史行為來自動學習

第三波人工智慧其實就是要解決「博藍尼悖論」(Polanyi’s Paradox)的問題,也就是專家往往不能把自己的決策原則,用系統化的方式說清楚。甚至,不同的專家之間的規則,還會出現矛盾、心口不一、沒有共識的狀況。

人工智慧(Artificial Intelligence, AI)其實不是一個新的東西,只是隨著時間的演進,發展出了機器學習(Machine Learning, ML)跟深度學習(Deep Learning, DL)。AI就像一個大範疇,裡面包含了ML跟DL。

Oracle介紹人工智慧、機器學習、深度學習的差別

機器學習可以分為以下四個大範疇:迴歸(Regression)、決策樹(Decision Tree)、支持向量機(Support Vector Machine)以及神經網路(Neural network)。第一個提到的迴歸可能會讓讀者想起統計學裡面的迴歸分析,那統計跟機器學習的差別是什麼呢?

  • 統計:使用科學方法,見微知著
  • 機器學習:使用工程方法,用已知的資訊去預測未知

而如果要更進一步要做到深度學習,就還要在既有的機器學習下,讓模型可以自動進行特徵工程(feature engineering),才可以算是深度學習。

在大致了解什麼是AI之後,書開始深度介紹AI的一些細節:

資料

  • 非結構化資料:文字、影像、聲音
  • 序列資料:溫度、濕度、交易資料

如果有足夠的資料量,深度學習才可以提供比機器學習更好的解答。所以如果資料量不夠多的話,也許使用機器學習或是單純的迴歸也可以提供不錯的解答。

學習

  • 監督式學習(Supervised Learning):使用Data Tagging的方式進行學習,告訴電腦一些標籤,讓電腦根據這些標籤去建立規則。90%的人工智慧都是使用這個方式,有名的例子如Alpha Go。
  • 非監督式學習(Unsupervised Learning):使用No Data Tagging的方式進行學習。
  • 增強式學習(Reinforcement Learning):讓電腦從做中學,找出自己的規則並且做出決策,有名的例子如Alpha Zero。

簡單來說,我們都希望把資料「餵」給電腦之後,他們可以產出一個通則,讓我們可以預測未來可能會發生什麼事情,同樣是Input跟Output的關係,但是隨著技術的進步,中間的「黑盒子」就有不同:

  • 專家系統:Input → Expert Rules → Output
  • 機器學習:Input → Feature Engineering → Machine Learning → Output
  • 深度學習:Input → Deep Learning → Output

如果只有小規模的數據,機器學習是會比較準的;如果擁有大規模數據,深度學習是會比較準的。

但是AI也不是萬靈丹,與情境相關的東西不容易預測,例如說戰爭(人為因素)、颱風(測站不夠密集)與地震(雜訊多)。AI擅長的領域比較是樣本數多,而且與情境無關的事情,例如下棋、車牌辨識、人臉辨識等。總之,例外不多的事情,很適合用AI。

AI擅長樣本多、情境低度相關的情況

「AI產業化,產業AI化」

書中提到,現階段真正懂AI的人都在學術界,但是學術界的人不懂產業,加上升等壓力跟法規限制,產學合作不容易進行。台灣有很多優秀的產業先進,但是他們不懂AI可以怎麼幫助他們的公司。簡單來說,產業界有實務資料、學術界有超過十年的AI技術,照理來說可以激發出更大的成果才對。

AI可以幫助製造業 (1) 瑕疵檢測、(2) 自動流程控制、(3) 預測性維護、(4) 原料組合最佳化。然而製造業在AI轉型上面臨到很多挑戰,例如資料取得不意、資源不足、人才短缺、IT基礎建設不足、找不到合適的題目等。

作者建議在導入AI的同時,公司的文化也要改善。要有實驗容錯的空間、資料導向決策(Data-Driven Decision Making)、不被KPI/ROI綁住等。而且在公司導入AI前,之前的「IT技術債」要先還完,不然是沒辦法越級打怪,直接享受到AI的好處。

最後作者提出三個可以發展AI的條件:

  • 影響決策值(Y)的情境與條件,可以被量化且紀錄下來成為觀察值(X),通常與情境非高度相關
  • X跟Y的樣本品質好、數量多
  • X跟Y的關聯是穩定的。如果X1與X2相似,則Y1跟Y2也應該要相似

總結來說,這本書很適合當作AI的入門書,而且也可以了解到AI可以怎麼跟產業界做結合。根據書中的敘述,零售跟金融是比較早導入AI的產業,但是製造業佔台灣經濟的比重比較高,若未來可以在製造業中導入更多AI,一定可以使台灣的製造業更上一層樓!

--

--

Tsanyu Kuo

PM@TAITRA | PhD Candidate@NCCU | ex-ASUS PM in Taiwan, Sweden and Serbia | LSE MSc Social Policy | English Tour Guide | Bookwriter