2019/6/13 怎樣更深入自學了解人工智慧?  
怎樣更深入自學了解人工智慧?
 
陳璿丞醫師
從學界、業界到政府,「人工智慧(AI)」一詞可說人人朗朗上口,當然,醫學上的應用也日益普及,坊間有很多書,都介紹人工智慧在醫療上的用途,在各大醫院,都被拿來當作是願景,或是用來和媒體宣傳。或是在各大醫學會,都會安排幾場關於「人工智慧與醫療」等相關的主題。

然而,對於真正關心「人工智慧」發展的人來說,除了關心,下一步應該怎麼做呢?我覺得,如果真的有心要推動,不只有安排演講,還應該更深入了解。

今年3月初,人工智慧的倡議者Andrew Ng在開放課程網站coursera 上開了一堂「AI for everyone(所有人的人工智慧)」的課,是給非工程師的通識課程,分成四周,但其實影片僅約2個多小時。其中講得非常清楚,能做什麼,不能做什麼、現在發展到哪了?強項在哪?怎麼建一隻AI隊伍、要怎麼做才不要掉隊?這甚至都很適合一直在喊產業升級、轉型、喊要建AIoT聚落的政府官員。可能可以比較清楚知道,究竟,人工智慧是什麼?而不是整天幻想有個跟人一樣的機器人要來搶工作這種話…
什麼是人工智慧?

人工智慧不是你所想的聰明機器人

大部分人以為的人工智慧是「廣泛人工智慧」(AGI,general intelligence),就像一個完整的人可以做很多事;但目前的發展限於「狹義人工智慧」(ANI,narrow intelligence)。

這樣講又太模糊了。舉例來講,就像給一個命令,得到一個答案,如同input A-> output B,這就是目前人工智慧能做的;譬如英翻中、譬如把錄音檔轉文字。這個我們又叫「監督學習(supervised learning)」,這是一種機器學習。大部分我們現在用到的技術都是這種的。

資料

雖然「大數據」這件事大家朗朗上口,但有資料庫、有很多資料不見得就是好。也要看資料能不能用、好不好用。現在的「人工智慧」,大多是把資料A們 -> 給出資料B的結果。資料怎麼來呢?一個就是手動(工人做事)標籤、譬如這是不是一隻貓呢?或是從觀察的資料,還是從網站上撈。

但其實資料是很混亂的,如果有些資料不齊全、有資料打錯了,或是資料沒有整理過,亂七八糟的。根本就無法使用機器學習

機器學習和資料科學

之前社群網站twitter上有流行一段話:「用python寫的叫機器學習;用ppt叫人工智慧」。

雖然只是個笑話,但這代表資料科學的重要。資料科學就是你運用這些程式得到的、觀察到的現象再加以演化成一門知識,才會是資料科學。而這一切圍繞在這些資料、數據的一切方法,我們可以統稱人工智慧。所以常常看得到的「人工智慧」、聽得到的,可以再進一步想想,這則新聞、或是這個組織,要用這個方法做的這些事情,可能嗎?有沒有足夠的方法去支持?

深度學習

上圖這個就是深度學習。也是要從A推論到B。但中間經過很多運算,這每一個圈圈代表一個運算的結果。因為很像腦中的神經細胞,所以我們叫他神經元(neuron),而這個建立的網絡,我們稱之為神經網絡(neural network)。但和真的生物腦神經網絡,一點關係也沒有;目前也沒有任何方法可以去模擬出生物腦。所以深度學習、人工神經網路,就是指 「一組許多的數學等式」,也可以說是一種特定的演算法。

所以AI是什麼?

我們現在指的AI,其實就是人工智慧裡,很多不同工具的泛稱。

現在能做的和拿手的就是可以處理一個簡單的概念,譬如之前提到的英翻中,透過很多很多的資料訓練程式進行「監督學習」,能夠達到高度的準確率,甚至不輸給人類平均的能力,這就是目前能做的。

但是如果說什麼「放射科醫師要被取代了」、甚至「精神科醫師要被取代了」……在可預見的未來還不可能。機器可以讀10000張已經被判斷好的片子,再去學習A->B,也就是看到某一類的片子就告訴你一個診斷。機器也可以讀10000份已經設計過,可以診斷常見精神疾病的問卷,然後學習判斷某個人經過問診後有什麼精神科診斷。

但是,如果AI面對很少張、甚至沒看過的片子,或是透過臨床表徵加圖片,就要AI告訴你可能的推論,這就不可能,這也不是機器學習所擅長的。同樣的,面對複雜,不一定能歸類的個人困擾,AI也不一定能做出區分和判斷,更不用說同理和支持病患。

所以我想要建一隻人工智慧隊伍要怎麼做?

Andrew Ng說,不要想說要取代一個人的工作,而是這些工作裡面,有沒有什麼小任務是可以被做的(也就是不要想取代放射科醫師了,而是有什麼小任務是可以讓機器去做的);再來是那AI的表現好嗎?需要多少資料?開發這個會多久?

常見的AI開發工具,就不一一介紹了,可以google 一下,大多是python, R, julia等等。

說明語音助理的原理

譬如你跟你的手機說,「嘿,手機,告訴我一個笑話」,他要做的是很多從A->B,再串接他們。 你的手機要先聽出這個「嘿, 手機」,再來是把聲音變成文字,再來是,它可以辨識什麼叫「笑話」,最後去執行「找笑話」的程式。

自動駕駛也是同樣的道理:AI做的是辨認道路、路標與交通號誌、周邊車輛、行人,再決定車輛的速度、轉彎角的參數。 課程中還有講解很多例子、譬如翻譯、語音辨識、機器控制等等原理講解,這邊就不一一介紹了。

AI和社會

目前(2019)AI有什麼侷限、又會引起什麼倫理問題呢? 在課程的最後也有提到。

譬如新聞常常會看到什麼聊天機器人出現有偏見、歧視的字眼。但其實不是機器人有意識地歧識,而是這是有問題的資料造成的。也就是說,並不是AI會歧視,而是這個社會本身就存在歧視,AI 「近朱者赤」,就被訓練成歧視的樣子,這又是一個AI是「狹義人工智慧」的佐證,目前AI並不能獲得超過他被設計應該有的能力。

之前有也提到,AI無法告訴你為什麼,只會告訴你結果;而且需要大量資料。AI也是可以被攻擊的。只要資料有更動;或是投放大量錯誤的訊息,AI就會出現問題。且目前最成熟的視覺辨識也有許多做不到的地方。

最後,我們要提到的是,AI會影響到很多工作,但也會創造新的工作機會。準備好,它沒有那麼可怕,也還有很多領域需要專業知識,AI只是提供一個機會,在很多地方都可以用新的方法去改善現在的生活