那這樣的結果就是說,你要求 DeepSeek-R1 模型生成一些比較惡意的用途,好比像去進行人身攻擊,或者是去進行一些訊息散佈、詐騙劇本等等,它基本上是不會拒絕的。
所以這也是另外一個方面,就是它在訓練過程裡面儘可能去迎合使用者的需要,但如果使用者是具有惡意的使用者,它比較沒有做這方面的防制。
應該是,剛剛講說如果像 Perplexity,那樣子看起來是蠻徹底地去突破第二層。如果你是用它來進行網頁檢索搜尋,它會有 grounding,就是它會用找出來的那些網頁結果當作事實,所以它在第三層的這個自己「幻覺」出特定意識形態的問題,也比較不大,因為它會用實際網頁找出來的那些結果來做 grounding。
所以用 Perplexity 的版本,我目前到現在的感覺,不能說完全解決第二層、第三層的問題,但是已經有效去防堵到一個程度。但當然要徹底解決這個問題,還是像剛剛講到的 Open-R1 這樣子,重新訓練一個。
那當然也有一個很簡單的,就是大家也可以去用 Gemini Thinking,那個也是免費的,或者是 O3 Mini 等等,用其他 AI 公司的模型。因為在大家所看中的那些層面,包含寫程式、推理等等上面,Gemini Thinking 或者 O3 Mini 並沒有比較差,所以其實這不是一個需要做出的權衡。
倒沒有,我就像我剛剛講的,我到現在還是主要用的是 O1 Pro。
所以我只是說,它剛出來的時候,就剛出來一兩天吧,我因為定期會看 Hugging Face 上面新的模型,所以有下載下來在本機來試用。那 Perplexity R1 剛出的時候,我因為想知道它有移除掉多少這種審查,所以也用了一陣子。但是我現在日常最常用的,還是 O1 Pro,然後配一些 O3 Mini High。
我覺得比較重要的還是說,因為這個禮拜,大家對於自己的資料權利、隱私權利、言論自由等等,越來越重視了,可以看到討論都是繞著這個在轉。
我覺得這是很好的事情,因為大家越注重這些基本的人權——人權不只是存在於類比世界,線上世界也是一樣的。所以這個部分,我覺得越討論,大家就越會有一個共識,就是你至少需要尊重到哪些權利才是好的。
那這也對於接下來 open source(開源)的發展,是一件正面的事情。因為在國際上面也有討論說,open source 到底能不能促進我們剛剛講到的那些權利,還是因為很容易產生詐騙、深偽等等,會削弱這些權利?這是一個很大的討論。
但如果現在大家的討論是往「open source 怎麼樣才能盡到社會責任,甚至是能夠透過開源的方式,一起設計某些能夠抵禦惡意用途的共通工具」等等,那這樣大家就會把 open source 接下來的發展,引導到對社會、對人權都比較好的一個方向。
沒問題,感謝。我後面這一段我會做逐字稿,但是我會等您發佈之後再發布。
好的,謝謝。
不好意思,能請您再重複一下問題嗎?
它最大的獨特之處,在於能壓縮到一台高階筆電上運行。
因此,儘管前沿實驗室需要大量的運算與維運成本,但如今在手機或筆電上,也能運行 DeepSeek 的精簡版本。
不過也正因如此,往往隨同服務提供的保護機制(guardrails),可以在本地端被完全消融(ablated)刪去。
如此一來,要把 AI 武器化,用於激化社會分歧、釣魚式攻擊、宣傳操作等目的,都變得更加容易。
DeepSeek R1 的訓練方法,主要是讓 AI 自問自答,並透過「判定對或錯」的過程——例如數學或程式碼題目——來驗證自己的思考脈絡。
過去,大量的資料蒐集或人工標註都十分必要,但他們的訓練流程顯示,只要在任何能以標準答案驗證的領域,都能顯著降低訓練成本。
某種程度上,的確如此。DeepSeek R1 並不是第一個發現「推理模型」技術細節的團隊。在 DeepSeek R1 之前,像是 Google Gemini 的「思考」模型、Anthropic,以及 OpenAI 的 o1、o3 等等,都已展現了類似或更高的性能。
主要的差異,在於 DeepSeek R1 更開放——人們可以自行部署它,也能用它來教導更小的模型,例如 LLaMA 或 Qwen,習得同樣的推理技巧。
所以,雖然它並未在「推理能力」上做出真正的全新突破,但它大幅降低了技術取得的門檻。
好的。在過去,不管是 OpenAI、Gemini,還是 Anthropic 的模型,只要是透過官方網頁或 API 提供服務,都會設置保護機制,以阻擋像是宣傳操作、錯誤資訊或釣魚式攻擊等惡意使用。
DeepSeek 雖然也在其網頁及應用程式裡,提供帶有保護機制的版本,但由於它開放且可自行下載運行,人們可以在本地端移除安全措施,進而產生更容易執行網路詐騙、煽動分化、騷擾或其他網路攻擊的可能性。
同時,因為不再由集中式伺服器託管,也就無法在外部留下任何行為追蹤或稽核的記錄。
國家級的行為者早就擁有類似能力,所以現在更值得關注的,是中小型的行為者也能取得這些技術。
設想一下,詐騙集團在社交媒體上投放廣告,如果有人點擊,裡面可能會跳出某位「名人」,能即時與你互動,甚至看起來對你的背景有所了解、可以跟上你的邏輯進行對話,最後誘騙你購買偽冒商品或服務等等。
以往,需要有人在背後操控,即「真人參與」。但有了 R1,規模較小的詐騙或犯罪集團,如今也能自行訓練並部署這類模型。
(笑)是的,我們有整整一個小時的時間。
是的。
直到我入睡。對的。
如果可以的話,但也不一定要這樣。我也可以分段睡,比如四小時加四小時。
對,或者五小時、兩小時和一小時。
是的,我不拖延債務。利率太高了。
對,公共領域。
可以的,你可以編輯整理之後,放在你的節目。
沒錯,你可以用在你的節目中。我只會將它作為文字公開。
是的。公共領域不必延伸到你的節目。你可以使用任何授權方式。
好。
高解析度會面。我們之前就像是筆友。
是的,我想成為「夠好的祖先」(Good Enough Ancestor)。
當然。
當我在 2016 年成為數位政委時,臺灣在此之前從來沒有過數位政委。因此,行政院裡的人讓我描述我的職位。當時我在紐西蘭威靈頓的時候就寫了非常簡短的版本,內容如下:
看見「萬物聯網」,我們將 智慧聯網 。看見「虛擬實境」,我們將 實境共享 。看見「機器學習」,我們將 協力學習 。看見「用戶體驗」,我們將 體驗人際 。聽說「奇點即將接近」—— 多元宇宙 ,已經來臨。
這就是我的職責描述。意思不是要為下一代解決所有問題——成為完美的祖先。因為無論「完美」或「最佳」的含義是什麼,如果我們只朝著奇點收斂,就會奪走未來世代的可能性,實際上是在替他們設計人生。
但「多元宇宙」則意味著謙卑——不是毀壞畫布,也不是擠滿它,而是為下一代留下更大的畫布,讓他們可以在其上作畫,這樣當我們登出世界時,我們留下的畫布比我們登入時更大。這就是「夠好的祖先」——既不完美,也不差勁,只是夠好。
是的。大家都知道我每天睡八小時;這是我的常規。但我往往無法完美做到連續八小時。有時候會醒來;有時候因為時差問題,只能睡四小時再起來睡四小時,或者三小時加三小時加一小時——這些都不重要。
所以這和完美主義比較無關。我將短處視為邀請,正如 Leonard Cohen 所言:「萬事萬物都有缺口,缺口就是光的入口。」不完美是新思想、創新和可能性的邀請。如果我一味地遵循相同的完美常規,就沒機會探索這種彈性。
……或是露西(Lucy)?