其實橋接演算法第一次大規模的被壓力測試,就是上一次的美國總統選舉。然後那次 Elon Musk,就是新聞記者做的那些事實查核,他是不相信的。他認為大的這些新聞媒體都受到某些偏見所影響。總之他有一套想法。所以他就決定 Twitter(X)不再使用第三方事實查核,然後全部都用橋接演算法來進行本來事實查核所做的工作。
當然我們很快就看到這個橋接式演算法它的缺陷。它的缺陷簡單講,就是「too little, too late」(太少、太遲)。
就是研究都證明說,你如果看到一個高品質的橋接的社群備註,那確實它對於沖淡極化、對於讓人跟人之間不要那麼彼此仇視,確實很有幫助。而且是會持續長時間有幫助。
但是你在當時美國總統選舉的時候,所有的這些非常偏激的這些發言等等,常常都是出現之後,可能要六個小時、七個小時,你才有個高品質的社群備註出來。而在那六七個小時裡面看過的人,基本上第一個不會回去去看社群備註。然後第二個是就算他回去看,其實他已經(被影響)了。就是他腦袋已經鎖定了錨定效應。所以他後面再看到說「事情其實不是這樣」的時候,他只會感到不舒服而已。
就是說社群備註他要生效,他必須是你第一眼看到的時候——就像 mRNA 疫苗一樣。就你碰到病毒的時候,你同時也碰到疫苗,那這個時候就非常有保護作用。但你如果是先中了,然後過一段時間再接種疫苗,那你一開始那個症狀還是有。那 X 平台他們的研究團隊,那就跟我們——就是剛剛講英國的合作式 AI 基金會合作。所以我們現在就是在做:讓 AI 來寫備註。
我們就不要等人寫出高品質備註。我們直接透過一個訓練方式,它叫 RLCF(Reinforcement Learning by Community Feedback)。
以前在訓練像 ChatGPT 的時候,他都是讓 ChatGPT 生出兩個版本。然後他們一開始是找非洲肯亞的一些人,然後去看說這個版本好還是那個版本好。所以你如果用 ChatGPT 寫英文,很容易就看到很多長斜線,或者是那個 “delve”(深究)什麼什麼的那些用詞。因為那是標準肯亞英語。
總之他們看到,就是肯亞這些朋友們,看到這個回應好、那個回應好,那他們就訓練出 AI 來。但結論就是說,這種 AI 就非常容易拍馬屁、非常容易逢迎諂媚、非常容易順著人講話,提供非常高的情緒價值。但是實際上,就是對橋接是一點幫助沒有。
所以 Grok 他們就提出一個不同的訓練方式。就是透過社群備註裡面,之前成功讓不同陣營的人能夠橋接起來的那些寫法。所以它不是讓特定的人高興,它是讓特定的橋接的能力變強。
所以它現在已經開放了它的程式介面。所以不止 Grok,現在也有人在用 Gemini,或者是像我們是用 GPT 的開放版本等等。任何人都可以參與,用機器去寫這些社群備註。所以這個 too little, too late 的問題,現在正在想辦法解決。應該 12 月左右可以解決到一個程度。
非常好的問題。我們目前用這些做法,都是在政策形成的時候,所謂的「議題設定」。就是說讓大家提出選項。但這個選項如果最後要收斂的話,那還是要透過本來的民主程序,不管是代議或者直接民主的程序。
但確實我們在加州,現在我們跟州長,就是 Newsom 有合作。我們有做一個平台叫 Engaged California(參與式加州)。本來的民主程序,像加州也有公投,跟我們剛剛講到這套生成式的橋接的這種程序(結合)。
大概的概念就是說,有點像是在臺灣很多提公投之前,會先到我們公共政策網路參與平台上面去試水溫。然後去試到說有 5000 個人的連署。然後正方意見、反方意見,同樣沒有轉推、沒有回覆。然後浮到最上面,大家發現說,我如果把這個題目寫成這樣的話比較好。所以它的公投題目就不是極化式的寫法,而是大家已經比較折衷過的那個寫法。
所以像在參與式加州這個平台裡面,我們當時就是在加州野火發生的時候。你如果個別去問加州的人的話,他們要麼就是所謂的 YIMBY(Yes In My Back Yard,歡迎來我家後院),要麼就是 NIMBY(Not In My Back Yard,別來我家後院),就是連電纜地下化、電線杆地下化都不願意,因為是他的土地。就是雙方吵得很兇。
後來我們就是透過這種橋接式的方式,去找到雙方都可以接受的見解。但是裡面如果有某些需要改到法律的話,那還是經過州議會的程序,或者是州的公投的程序。
但是我們現在也在想說,可能就參照臺灣,如果有一萬個人連署的話,我們就先做一次審議式討論。審議式討論最後凝聚出來的,再送到公投,或者再送到州議會。可以這樣來搭配。
所以公投這個形式還是必須要有。但是實現的那個主文,是大家已經凝聚過。所以公投大家就可以期待是 85%、90% 這樣通過的,而不是說好像都是 51% 贏、49% 輸這樣子。
我在 2016 年加入內閣之前,我本來是 12 年國教課發會的委員。我們在課發會當時設計的新課綱,就是現在叫做 108 課綱的想法。在討論的時候是已經 AlphaGo 就是已經下贏李世乭的狀況。
所以當時就已經可以預測到說,只要是有標準答案、有標準流程的事情,先是認知性的事情,機器大概都會做了。接下來操作性的東西,機器大概也都會做了。
所以如果 12 年國教,就是我們一個 7 歲、8 歲的小孩,你一開始就教他有某種一技之長勝過別人。然後剛好他學 12 年之後,AI 就把那件事情做掉了。那他應該會非常的失落。
所以我們那時候就在討論說,那我們可不可以就是不要像之前那樣子,變成好像每個人都找到他專精的,但是一致性的標準答案等等這個地方。那有沒有哪些是,就算認知性的跟操作性的、有標準答案的機器人都可以做掉的情況下,仍然還是有價值的事情?
那當然後來我們就凝聚成三個核心素養。現在大家應該都知道:自發、互動、共好。
那意思就是說,就算機器人可以做掉所有標準化的東西。「我自己的好奇心」這件事情,還是機器不能取代的。「我想要跟我不同的人之間彼此之間互相合作」的這件事情,還是機器沒有辦法取代的。那以及我們要怎麼樣子去把好像就是你輸我贏、你贏我輸、或者你輸我輸的這樣一種情況,去把它翻轉成雙贏、多贏的情況。這個操作也不是 AI 可以來幫人做的。因為這是人跟人之間的關係的一部分,就是關懷的部分。
所以這些部分都跟標準答案沒有關係。所以我們那時候就設定這些是所謂的核心素養。
所以我後來當然也擔任社會創新相關的政務委員。我們當時也有說,大學就是高等教育,他也可以一定程度上,不要變成說好像每個人各自發展他自己的學問。而是說他在發展學問的過程裡面,也可以去透過互動達到共好。
所以當然好奇自發的部分,還是每個學生自己要做的。但是他可以透過一些社會的責任。每個大學可以勾一些永續發展目標,169 項,看大家要勾幾個。在附近 USR(大學社會責任)做到一些有幫助的專案。如果成功了的話,當然非常有成就感。如果沒有成功也可以發論文。總之就是讓大家怎麼樣都覺得有學到東西,這樣的做法。
所以我想當時都是因為 AlphaGo,然後一開始就可以看到這種 AI 的起飛,所以我們設計了這樣一套做法。現在回過頭來,我想這個方向還是對的。
只是說我們怎麼樣讓整個社會都可以了解到,像以前那樣就是個人跟個人之間的競爭,其實越來越沒有意義。而且所有時間過去,只會越來越沒有意義。關懷的能力才會越來越有意義。我覺得大家越把這個概念能夠擴散出去,我們在終身教育上就越容易。
對。我之前有跟東京大學的校長有聊過這個題目。因為東京大學大家如果有看漫畫都知道,大家都知道是非常注重那個筆試的。就是考滿分的上東大,大家都知道是這個狀況。
但是他們也發現說,第一個就是在有 AI 的情況下,每個人筆試能力都一樣好。你作文沒有辦法拼得過 AI 了。他們本來覺得說,好像日文是有非常多很困難的部分,機器語言處理是不能處理的。但是到 GPT-5 出來,他們去做評比。
我們在資訊科學界有一個叫圖靈測試(Turing test)。就是你要一個人看另外一個人的打字,然後再看電腦的打字。然後你要區分說這個是人,還是這個是電腦。到 GPT-5 出來的時候,好像 70% 多的人會覺得 GPT-5 才是人,另外那個是電腦。就是說它已經比人更像人的情況。所以你靠筆試去測任何東西都是不準的。因為你就叫 GPT 幫你寫就好了。
所以他們現在東大明年會翻新他們的學制。他們會有一個叫做設計學院(Design College / Design Institute)。他們的整個評量方式就都是跨科系。然後是以完成特定任務,就像我們 PBL 那種概念。然後就是以專案為主軸的學習(Project-Based Learning)。以 Purpose,就是以特定的社會使命為主的學習。然後是透過同儕互評,甚至是跨班互評來進行討論。而不是說由一個人去審說你的書審有沒有用 AI 等等。這些事實上都已經沒有意義了。
所以在這個情況下,我想在未來這種就是透過團隊,然後看這個團隊怎麼樣善用 AI,當做這個團隊的輔助或者教練。而不是說去增強團隊裡面每一個個人的這個能力。我覺得顯然會是未來的主流。東大開始做什麼,別的學校就會開始跟進。所以應該很快就會普及了。
維基百科什麼都要倒閉了。
非常好的問題。這個我在 Harvard Kennedy School 有一篇文章叫《Sunset and Renew》,講的就是 230 要怎麼做調整。
其實 230 在美國的一些法院,州級的,它已經有一些判例顯示說:如果你是——我就講名字——TikTok。那你已經知道裡面某一些影片它是違法的。但是你在使用者已經檢舉它違法的情況下,你又推送給其實沒有訂閱這個創作者的使用者。那這個時候他不能夠免除責任。
然後加州的州議會,先前已經通過一個連帶責任法案。是說同樣的就是違法內容,如果平台明知其為違法,而且又把它主動推送給就是被動接受、我也沒有訂閱這個創作者的人的話,那他也要負一些責任。
所以這個我想,我們在英文是把 speech(言論)跟 reach(觸及)分開。就是說你有完整的言論自由,你愛講什麼就講什麼,也絕對不會被下架。但是如果平台主動推給當初沒有訂閱你的人,平台的推送行為,就要算做他的第一方言論,那就變從犯了。簡單講就是這樣,我覺得是蠻直觀的。現在應該是共和黨可以接受的一個解決方式。Brendan Carr 他們可以接受的一個方式。
當然如果更細究的話,就是說如果我自己現在訓練出一個推薦模型,然後是我拿著我的推薦模型去這個社群平台。如果是我自己使用者訓練的推薦模型,那是不是所有我收到的東西,我自己就要負責任了?理論上是。
所以如果是這樣的話,我覺得這個就很好。就會變成是一個向上競爭,而不是逐底競爭的狀況。
因為你就會看到,像維基百科,他絕對不會主動推給你什麼你沒有訂閱的東西。所以維基百科繼續享有絕對免責。
如果今天是 Bluesky,他本來就是分散式的架構。他不會主動給你任何東西。你要看任何演算法的 feed(資訊流),那就是你去訂閱的。如果那個 feed 的創作者要免責,那他就是透過像我們剛剛講 Green Earth 這種工具,去讓你客製化你的推薦引擎。一旦你說「對,這就是我的推薦偏好」之後,那使用者又負全責。所以平台就免責。
所以這樣這個平台就有充分的誘因,去做我們剛剛講到的,包含可攜性在內這些事情。所以整個市場應該就會變成一個比較好的,就是 positive sum(正和)的一個競爭。
所以我是覺得蠻不錯的。尤其是美國是特別適合這樣做。因為他們許多人都對機構化的事實查核已經完全放棄信任。所以他們除了橋接式這一套、可攜式這一套之外,他們也沒有別的選項了。
反而是亞洲或歐洲很多還是很依賴傳統的大型的事實查核機構。可能就要看美國這個實驗成不成功,我們再看要不要跟。
我們去年的那一個,當然是變打詐專法,跟變成我們叫數位簽章,就是電子簽章法修正案。
如果現在在講的是說,怎麼樣再加強它的拘束力。就是變成……因為其實現在你如果是在公共政策網路參與平台上面提連署案,它正反雙方,其實現在都是用橋接的方式在做 aggregation(統整)。
但是當然它的強度、它的拘束力,並沒有強到相當於立委通過的法案,或相當於公投。它差不多就相當於立委提出的一個質詢案的,就是備詢的那個程度而已。
通常學理上我們是希望用兩個方法。一個是說盡量在小規模的地方先做。像芬蘭他們在全國做這個之前,他們就是先在一些試點的這些,類似我們縣議會、或甚至是一個里的里民大會的那個程度而已。
像我們在美國 Bowling Green 在 Kentucky(肯塔基州鮑靈格林市),就幾千人而已,相當於我們一個鎮。在那個人口裡面,他們就比較容易給出高的拘束力。裡面大概一兩千人有參與這個。說真的非常有代表性。大家都同意的話,我也不需要鎮長說什麼。大家都覺得說這個很棒,那我們就去做了。