
導語:8月6日,由北京師范大學未來教育高精尖創新中心主辦,北京師范大學現代教育技術研究所、“移動學習”教育部-中國移動聯合實驗室承辦,智慧教育國家新一代開放創新平臺協辦的“數智賦能教育·課堂融合創新·教師專業發展”數智化轉型推動教育的高質量發展研討會暨全國“基礎教育跨越式發展創新試驗研究”2023年會在北京寬溝會議中心舉行。 會上,北京師范大學副教授、未來教育高精尖創新中心人工智能實驗室主任盧宇作“生成式人工智能及其教育應用”報告,分享了生成式人工智能的定義、技術能力、應用演示、應用展望、局限與潛在風險。
觀點 | 盧宇 近年來,人工智能技術在包括教育在內的多個垂直領域有非常廣泛的應用,但同時,它也有很多局限,比如在智能性和通用性上都存在很大問題,無論是現在的智能評價、自動批改作文,還是個性化學習軟件平臺,其實都有這些問題。
而之所以大家今天都在談論生成式人工智能,其實就是因為它有可能可以解決當前的這些瓶頸。舉個最簡單的例子,在生成式人工智能的加持下,可能蘋果的 Siri 或者小米的小愛同學就不再像以前那么“愚蠢”,只能做一些最簡單的問題回答。 簡單來說,生成式人工智能指的是利用一些預訓練的大模型,來生成文本、圖像、視頻、音頻等多模態內容的一種技術,它又可以稱為人工智能生成內容,簡稱AIGC。它所生成的模態很多,而且也不只是這一兩年才開始被使用。在文本生成方面,很早就有人開始做詩歌的人工智能生成創作,現在商業領域也在做一些營銷文案類的文本生成,當然,最引人注目的還是一些交互式聊天對話文本的生成,比如ChatGPT。在圖像生成方面,中央美術學院其實幾年前就在畢業畫展中和微軟合作,做了印象派、抽象派等各種各樣風格畫作的生成,當時的質量已經很好了。現在很多電商的banner和宣傳海報,也都在做圖像的生成。在音頻生成方面,最早的時候可能做一些基本的不同風格音樂的生成,現在可以把作詞、作曲、編曲、演唱、混音等綜合起來做音頻內容的生成。最后,在視頻生成方面,三四年前就有學生利用一些相關技術替換頭像,做一些電影橋段的內容改編。現在大家在今日頭條的推送里可能會看到很多清朝、民國時期的原始畫面被修復成了彩色的,非常逼真。這些都是生成式人工智能在視頻生成上的具體成果。 生成式人工智能很早就已經出現。在上世紀50年代,就有了第一支由計算機創作的弦樂四重奏《依利亞克組曲》;在本世紀10年代之前,就已經有了人工智能創作的第一部小說,注意是小說,并不是簡單的一篇短文或者作文;到了2022年年底,大家最關注的是ChatGPT。所以生成式人工智能本身是有非常好的歷史沿革,在技術上也有很多相關儲備。 我們團隊從大概2019年、 2020年就開始關注 GPT-2 和GPT-3,我們先暫時不看它里邊復雜的技術,只講它的基本的外顯的參數量。GPT-1是2018年開始有的,在二零零幾年的時候,幾百個參數就是一個很大的一個模型了。但是到了2018 年, GPT- 1的參數達到了1. 17 億。GPT-2跟GPT-3的參數量分別是150億和1750億。ChatGPT實際上是GPT3.5的加強版或者改進版,它其實也不是 OpenAI 的一個里程碑式的軟件系統版本,但是它確實展現出了非常強的能力。看參數量也可以看出來,從1億到 1750億,大概只用了兩到三年的時間就展現出來了。大家知道人腦是多大的參數量嗎?人腦是由生物神經元組成的,假如我們把生物神經元里邊的每一個突觸認為是一個參數的話,人腦的參數量大概是 100 萬億個。ChatGPT的參數量大概是人腦的1/ 1000,但僅僅是1/ 1000 的量級,就已經能讓它做非常多事情了,至少沒有一個人敢說自己比 ChatGPT 更博學,對吧? 那么,ChatGPT有什么樣的能力呢?簡單來說,可能有以下四項基本能力:第一,啟發性內容生成能力。也就是說它能根據一些特定的主題或者給定的指引,在多輪對話的過程中生成啟發性和創造性的文本,包括詩詞、故事、評論等等,這是之前的自然語言處理系統很難達到的。第二,對話情境理解能力。這也是一個自然語言處理系統一直在試圖攻克的問題,也就是上下文理解能力或者多輪對話的理解能力。如果去問蘋果的Siri或小米的小愛同學,你會發現只能跟它說一兩輪的話,對話長了之后,它基本上就已經忘掉了之前整個對話中的情境。但是ChatGPT和你對話十幾輪之后,它還是能繼續把之前對話中的一些具體意義和情境聯系起來。這是有很大突破性進展的一方面。第三,在具備啟發性內容生成能力和對話情境理解能力的基礎上,它有很好的序列任務執行能力。在多輪對話的過程中,可以把一些復雜的任務交給它去一步一步完成。第四,程序語言解析能力。ChatGPT能夠根據多種編程語言的語法規則、數據結構、算法構建與編程規范,對代碼程序進行結構與算法分析,并根據用戶任務需求自動生成符合任務要求的代碼程序或錯因解析。 前幾天我錄了一個小視頻,我想知道,如果我是一個語文老師,GPT-4能幫助我做什么?我先輸入了朱自清的《荷塘月色》這篇課文,想看它能不能幫我做一些備課相關的事情,比如能不能找到這篇課文里的比喻句和擬人句,并且分別輸出。 GPT-4分別給出了三個比喻句和三個擬人句,還標注了頁數。接著,我讓他找出朱自清引用的詩詞歌賦,輸出引用段落的完整內容,給出出處,并對主要內容進行總結。 它給出了兩篇引用的詩詞歌賦,一篇是《采蓮賦》,一篇是《西洲曲》。這兩篇分別講了什么內容、出處是哪里,GPT-4都給出了具體的信息和來源鏈接,它總結得還是很好的。然后我想,能不能根據這三篇文章中的關鍵詞,由GPT-4生成相應的圖片,我放到備課的PPT里?


 《荷塘月色》的圖,確實有荷塘也有月色;《采蓮賦》的圖,也確實和蓮相關;《西洲曲》這幅圖,好像和文章的直接聯系沒有那么大。但是,至少我們看到,GPT-4可以很輕松地生成多副對應不同古文或者現代文的圖片。假如我是一名新老師,完全沒上過《荷塘月色》這節課,我還想知道,學生會在課堂上提什么問題?我應該怎么回答?所以我嘗試讓GPT-4做一些角色扮演的工作,這也是現在生成式人工智能很擅長的一點。
 GPT-4分別扮演了有教學經驗的語文老師、語文基礎薄弱的學生和語文基礎教好的學生。我和認識的語文老師討論之后認為,GPT-4的回答還是符合教學基本要求的。接著,我讓GPT-4分別生成一道選擇題和一道作文題,它都生成得非常迅速。
 可見,對于老師尤其是新手老師來說,備課的時候問GPT-4幾個問題,還是有幫助的。除了備課,老師還需要做什么?比如上完三個班的《荷塘月色》這節課,拿到所有學生的作文成績之后,傳統的情況下是需要老師把分數一個個輸入Excel,做分析。但現在我們就可以交給GPT-4來做。 我們簡單地輸入一段話,GPT-4就可以自動生成非常多的分析數據,包括學生的分數段、不同分數段的學生分別占多大比例、所有學生的平均分是多少等等。它還會自動選擇合適的圖,比如用圓環圖或者扇形圖來做基本的展示。在這個過程中,它可能會出錯,但它現在已經具備了基本的代碼自我修復能力,經過修復之后,它又可以繼續進行任務。視頻中可以看到,它完整列出了班級1、班級2、班級3相應分數段的百分比。在可視化展示的時候,它可能覺得在這個情境下調用柱狀圖比較合適,所以就自動生成了柱狀圖來展示這三個班級各自的信息。同時分析了主要存在的問題,并且做了班級間的對比性總結。在生成雷達圖時,GPT-4又出現了錯誤,但它花了大概5秒鐘就自動修復了這個錯誤,然后生成了一個疊加三個班級數據的雷達圖。這次考試的區分度好不好?正態分布合不合適?然后,GPT-4又做了展示正態分布的圖,到這里,其實已經上升到了偏教研視角的對作文題目進行評價的地步。最后,它還分析了三個班級的基本情況和存在的問題。當然,它分析得不一定對,但是在我只輸入了非常簡短的一段話,且沒有做任何新的提示的情況下,GPT-4就自動完成了這些非常豐富的內容。這是我想給大家展示的一個簡單的例子。 既然GPT-4有這些能力,那么我們對于生成式人工智能有哪些教育應用,可以有怎樣的展望? 對于生成式人工智能,我們一般都在講它是基于預訓練大模型。預訓練大模型本身是一個超大規模的神經網絡,現在國內最好的高校都不一定能做得了,但是在大模型的基礎上,我們可以繼續做它的遷移學習。也就是說對于一些具體的下游任務,可以通過一些少量的數據做微調,把大模型基本的通用能力聚焦到一些特定任務上,比如教育教學中教學材料、教學資源、教學評價等等這些任務的生成。經過微調的模型,就能解決人工智能以前根本不能解決的教育教學問題。總體來講,除去人工智能本來已經解決掉的一些教育應用問題之外,目前生成式人工智能可以著重解決以下幾個問題: 首先,基于多模態的數據與知識(無論是互聯網數據還是學科領域知識),結合教學場景,完成對于教學對象以及教育資源的一些理解。實際上,在高維空間上,大模型現在已經可以對這些教學對象和教學資源做更深維度的理解。在這個基礎上,它就可以更好地理解教學目標和教學過程,最終可以做一系列的適配的教育任務的模型,包括教師的智能輔助、教學資源的自動生成等,最終達成人機協同的過程支持。剛才那個例子里,作文題目、選擇題這些教學資源的自主生成就很簡單,老師也可以調整這些題目的難易程度和所考核的知識點。還有教學智能輔助,生成式人工智能可以輔助老師去模擬課堂中不同角色間的提問和回答。上個月,我們在東京的全球頂級人工智能教育大會上和卡內基梅隆大學做了一個workshop。我們模擬5個不同角色的學生,完整模擬了一堂課的基本演進過程。除了幫助老師準備課程,很多時候對于學生而言,通過第三者視角去觀察整個對話的過程,其實也可以促進他們的自學。教學資源生成和教學智能輔助這兩者結合在一起,就可以完成人機協同的過程支持。比如前面的例子中,老師以后要寫教學總結報告,不需要再手動生成圖表、填充文字。老師可以首先對機器給出一個基本的任務目標,接著不斷讓它調整你具體想做的一些小的任務,最終它可以自動調取相關的代碼。老師們就不用再跟代碼或者office里的一些編程功能打交道,機器可以自動生成相關圖片和文本。對生成式人工智能的應用,可以讓我們在教學資源的自動生成、教師教學的智能輔助以及人機協同過程的支持這三個維度上,做得比之前更好。 首先,所有人都在講,它可能會導致學術誠信問題。另外,生成式人工智能本身是大規模的神經網絡,一般規模的神經網絡的可解釋性本身就很差,這種超大規模的神經網絡的可解釋性更差,所以它生成的內容的依據就可能有很多問題。它的中文表達能力也比較弱,因為不管是GPT-4 還是其他版本,基本都是在拉丁語系的語料庫上進行訓練,中文只占很小的語料比例,但是通過我們舉的例子,大家可以看到,它對于中文的理解和語言表達,至少在中小學教學這個層面問題不大,總體上能滿足基本教學要求。另外還有知識產權問題、高成本問題等,都是它存在的一些局限和潛在的風險。 最開始看這幅圖,我看到的是生成式人工智能的有形之手把智能機器放到了社會各種協同工作的場景中去,教育也是這些場景之一。但另一方面,這只無形之手可能會把那些不太愿意或者不擅長用人工智能的教師逐步取代掉,把他們剝離出現代社會發展的隊伍,所以也希望各位老師多關注這個領域的一些應用成果,多嘗試,跟上人工智能時代發展的腳步。注:盧宇,系北京師范大學副教授、博士生導師、未來教育高精尖創新中心人工智能實驗室主任。本文整理自“數智賦能教育·課堂融合創新·教師專業發展”數智化轉型推動教育的高質量發展研討會暨全國“基礎教育跨越式發展創新試驗研究”2023年會。 《教育信息化100人》是由產學研媒聯合發起的智庫型媒體,關注教育信息化、教育數字化、智慧教育、互聯網 教育、人工智能教育、教育技術等領域,我們要“讓優質的信息和知識更快被看見”!
|