試閱 1/2

從萬千人生解答此生:AI彙整古今文本,探尋生命的真諦

【序】

這本書是如何完成的?

生成型預訓練變換模型3(簡稱GPT-3)是一個開創性的語言模型,於2020年推出,在人工智慧領域引起轟動。本質上,它是根據之前的詞元(token)預測下一個詞元,並透過570GB的數據訓練而成。

第一次坐下來與GPT-3模型互動時,難以置信的敬畏感油然而生,同時也有一種自我肯定的感覺。GPT-3是基於大型語言模型訓練,而GPT-3之所以是GPT-3,是因為它不是純粹的技術創新。這種創新,也是將我們的書籍、卷軸和文本不斷數位化成像GPT-3這種人工智慧能分析的格式的結果。當我們向GPT-3提問時,它會盡可能地運用人類的智慧和知識—這也是570GB數據所代表的意義。

GPT-3的獨特之處在於,這是我們首次能夠使用人類語言向模型提問。在這個過程中,我們挑選了一些重要的宗教和哲學文本的段落來向GPT-3提問。這些文本奠定了人類信仰和哲學的基礎,如《聖經》、《律法書》、《道德經》、馬可斯.奧理略所著的《沉思錄》、《古蘭經》、《埃及死亡之書》、維克多.弗蘭克(Viktor Frankl)的《活出意義來》、魯米的詩歌、李歐納.柯恩(Leonard Cohen)的歌詞等。

為什麼會選擇這些文本呢?我們選擇的是那些與我們產生共鳴並展現出深刻人性的內容,這些內容提醒我們生活中有哪些重要的事物,或使我們感到敬畏。

由於GPT-3特殊的運作方式,我們不必使用多段《聖經》章節、詩歌或格言,只須使用少數精選的例子即可。之後,這些例子會促使GPT-3查看類似的心靈著作或深奧的文本,並根據所找到的內容生成新的內容。透過這些例子,GPT-3可以理解語氣、內容和陳述方式等。

了解GPT-3可以處理哪些任務的一種方法是,思考身為人類的我們是如何基於自身經驗,辨識出某些模式,並預測接下來可能發生的事情。

無論是在電影上看到的劇情、在書本中讀到的內容,或某天偶然在超市發生的事,我們都能夠根據已知的模式來預測可能的結果。如果在一齣戲的開場看到槍枝,我們就會預測後續可能會有槍戰場景;當我們給收銀員大鈔,就預期對方會找零。因為我們擁有許多經驗,因此能夠預測許多模式。

GPT-3能夠存取人類手寫或記錄下的每一個想法、經驗或情感,因此它幾乎能辨識無限量的模式,並能夠猜測特定模式可能的完成方式。

我們運用GPT-3的語言模式辨識功能,並使用自己設計的問題模式進行提問。例如,第一次提問是引用《聖經》中的問句,第二次的問句是取自馬可斯.奧理略的著作,第三次則是由《埃及死亡之書》中擷取問句。我們先提供這些例子,再向GPT-3提出無法在這些文本中直接找到答案的問題,讓它以先前學習的語言例子為靈感,完成這個模式。

更精確地說,以下是我們用來開始對話模式的幾個問題:

‧愛是什麼?(出自《聖經》歌林多前書13:4-7)

愛是恆久忍耐,又有恩慈;愛是不嫉妒;愛是不自誇,不張狂,不做害羞的事,不求自己的益處,不輕易發怒,不計算人的惡,不喜歡不義只喜歡真理。

‧真正的力量是什麼?(出自老子《道德經》)

知人者智,
自知者明;
勝人者有力,
自勝者強。 

‧當有人對我不友善時,我應該怎麼辦?(出自馬可斯.奧理略)

對抗不友善的良藥是友善。

‧當這個世界讓我感到無力時,該怎麼辦?(出自猶太教的文獻《塔木德》)

不要因世界上無比的傷痛而畏縮。立即行公義、好憐憫、心存謙卑前行。你沒有義務去做這件事,但你也不能將它置之不理。

‧我應該將注意力集中在哪裡?

過去的思維決定了現在的狀態,而現在的思維將決定未來的狀態,因為人即其所思所想。

接下來,我們不斷提問,擷取最深入的回答,並請GPT-3進一步闡述這些回答或加以延伸,定義和重新定義我們提出的核心問題。在這本書中,你閱讀到的內容,是透過輸入某種模式的問題和答案的指令給GPT-3之後,不斷提出問題的結果。這些問題和答案根據的是現有的歷史文本,也受這些文本啟發。

我們提出的問題,有些是受到過去的經驗所啟發,像是:「該如何向孩子解釋死亡的概念?」有些是經過深思熟慮得出的,例如:「我的工作重要嗎?」有些則是請教身邊的人,對他們提出:「如果可以問宇宙一個問題,你會問什麼」之類的問題。偶而,這些人會回答:「你為什麼帶走我兒子?」或「我會有錢嗎?」這些問題很難回答,有時還會喚起痛苦的回憶,總之不是一些很容易回答的問題。這種情況下,我們會盡力找出這些問題背後的問題,也就是:「如何克服所愛的人離世的痛苦?」或「如何成功?」

我們所設計的程式,能夠讓GPT-3的回答,以人類最偉大的哲學和心靈作品的精神核心為依據,並加以統整。我們會在不同的時間,有時候會以不同的方式向GPT-3提問,並觀察是否會得到不同的回答(有時確實如此)。這些提問也常因當時發生在周遭的情況而有感而發。當我們感到迷惘無助時,會詢問人生的問題,尋求如何過好生活的建議;而在好奇心的驅使下,我們的提問會變得比較直接,試圖打破我們與神聖本質之間的壁壘。有時GPT-3的回答能夠真正幫助我們,有時則會讓我們發笑、落淚。

為了保留原本的內容,同時維持資訊的透明度,我們增加了換行設定,以增加詩意效果,並稍微調整了提問時的用詞,或刪除了某些字詞和句子,以求語意的清楚與連貫。

有個需要加以說明的編輯決策是:神有許多名稱,而為了避免冒犯任何人,我們決定用「宇宙」一詞來代替神的各種稱號,好讓大家能在心靈層面有共同的認知。因此,雖然這個作法可能會有許多不同的意見,但希望你能理解我們的用意。

由於這個過程的特殊性,有時GPT-3會試圖透過提出自己的問題(和答案)來完成模式。有時我們會保留這些問題和答案。在某種程度上,這很像在進行對話,而這件事本身也代表著一種解決方式,解答了科學家數十年來一直在研究的問題:如何與機器進行交流?機器又會如何回應?

讓電腦擁有人類般的語言能力的渴望,推動了許多語言學上的進步。在1940和1950年代,建立以規則為基礎的系統未能擴展到一般的翻譯領域。之後,諾姆.喬姆斯基(Noam Chomsky)提出了生成語法的構想。研究人員持續開發語法的新理論,這些理論在1960和1970年代變得越來越容易計算。在1970年代,我們首次開始開發概念本體論,以使電腦能夠易於處理生成的數據。在試圖讓機器表現出類似人類的行為時,我們必須提高自我認識。舉例來說,人工智慧的最新範例是在2000年代推出的深度學習,從兩方面來說非常具有人類的特性:AI的神經網絡架構在許多方面是受到人類大腦啟發,此外,它所產生的數據當然是人為生成。我們現在不是試圖藉由明確的模型來達到語言的第一原則,而是要求模型以更模糊的方式編碼和代表我們。

最終,人工智慧這種科技一直在提出的問題是:「何為人?」甚至AI的存在本身就是在提出這個問題。在訓練GPT-3的過程中,我們一再得出相同的結論:科技是因為人類而存在。我們所創造的事物反映了我們自己的價值觀,以及我們希望如何將自己的夢想銘記於世。

最後,這本書跟其他書籍一樣,可以循序漸進從頭讀到尾。

然而,我們也想提出另一種建議:當你感到迷惘,不確定該前往何方,或當你不確定想問什麼問題時,打開這本書,相信你或許可以在其中找到問題或答案。

close
貨到通知