ChatGPT Prompts for Chinese Learners | 用ChatGPT學中文
第二語言(L2)習得領域中,「個人化」是一個宏大的理想,一直以來卻難以實現。縱使根據前人的研究證實,通過自我參照(self-reference)等個人化的語言學習機制可以提高學習質量和知識保存(Coyle, 2008; Albdrani & AlShargabi, 2023),然而由於教師的時間限制以及客製化材料的缺乏,傳統的語言學習方法往往無法滿足某些學生的需求(Brady, 2021)。當學習者對學習材料缺乏興趣時,可能會失去學習動力。我認為,在語言課堂中使用大型語言模型如ChatGPT等,可能有助於改善這種情況,從而協助不同學習需求的語言學習者。 ChatGPT在理解、生成和解釋多種語言的文本方面具有極強的能力,尤其是在最常學習和使用的語言中。與L2教師不同,ChatGPT擁有廣泛的資源,可以提供反饋、生成材料,並與各個水平的學生互動。我們需要進一步了解如何使用ChatGPT幫助學生進行個人化的語言學習。本文在此基礎上,探討了人工智慧如何改變L2語言課堂:第一步就是使用ChatGPT生成語言學習的材料。 我曾經上了長達九年的中文課,在這個漫長旅程中,我已十分熟悉傳統的L2教法以及教材。學習初期,教科書提供的對話和例句非常實用,比方說家庭、天氣、就業和購物等常見主題。然而,隨著我的中文水平提升,我漸漸感到喪失興趣,因為我幾乎無法找到和我興趣相符的科技文本。我曾努力尋找並學習在科技方面可能會使用的語法和詞彙,然而卻搜集了許多並不常見也不太實用的說法。 2023年秋天,我在臺灣大學國際華語研習所(ICLP)報名了兩門客製化的語言課。我使用的兩本課本分別是以新聞素材為基礎的《華語新聞面面觀I》和討論中國歷史文化的《中華文化叢談》。上了幾週後,我開始反思我設立的學習目標,決定嘗試使用ChatGPT生成自己的中文學習材料。 我之所以決定自己生成教材有以下幾個原因。首先,在本科教育中,我鑽研新興科技的道德、倫理和社會影響的內容,因此使用中文討論這些話題是我學習中文的目標之一;其次,我希望實現促進東西方文化交流的個人目標。如果我能成功開發出一種幫助學習者生成自己L2學習材料的方法,應該也能夠幫助學生參與更多的文化交流;此外,由於許多教科書昂貴但不一定完全符合學習者需求,我試圖尋找低成本的替代方案,希望有益於L2中文學習者;最後,我意識到這種學習方法不僅適用於想學習新興科技的中文學生,也適用於對不同主題感興趣的L2學生。以上這些原因促使我追求我的理想並開始生成自己的教材。 我向ICLP提出了這個想法,當時我的兩位授課老師同意參與課程實驗,並使用我生成的教科書來教學。在為期兩週的課程中,我一共生成了包含七個章節的教科書《科技浪潮中的人文對話》(見附錄1)。我用這本教科書學習了七百零七個新詞彙,並學習了總字數一萬多字的十四篇新聞和長篇文章。參與的教師使用了教科書中的材料來設計我們的課程,在本次的課程實驗裡,教師和我一起審查和擴展了教科書的內容,並討論了這些材料的意義。 這是我在中文課堂中第一次感覺到自己既可以學習中文,又可以探索我感興趣的主題,如新興技術、人工智慧、虛擬現實和技術倫理等。我根據預先設計好的英文指令生成了這些文章,所以我已經了解了文本的內容,但我仍然覺得通過華語的獨特思維過程來擴展我的詞彙,並思考這些主題令我十分興奮。此外,我充滿動力完成每項作業,因為我知道這些作業對我未來想要討論的話題有所幫助。 使用ChatGPT生成教科書讓我能夠專注於我的興趣和專業,然而,也需要付出努力:我必須花三十分鐘來生成每篇文章的語法、詞彙和討論問題。生成材料所花費的時間是我本來可以用來學習的時間,這種時間投入有時相當密集。 大多數情況下,ChatGPT生成的文章符合我對內容、長度、寫作風格和難度水平的要求(附錄1.1)。然而,這些文本仍出現一些不適切的語言表達。因此每篇文章教師都花費大約半小時進行質量控制,並調整ChatGPT的措詞,使文本閱讀起來更加自然。ChatGPT生成的的詞彙列表(附錄1.2),成功選取了文章中大部分我還未學習過的詞彙,把這些生詞編入詞彙列表中。ChatGPT還生成了有趣的課堂討論問題(附錄1.4),儘管某些章節的討論問題是重複的,未能有效激發深思及課堂討論。ChatGPT最大的弱點在於無法生成有效的語法結構列表。儘管能生成一些語法模式,給出文章中使用的語法結構的翻譯、解釋和例句,但經常只選擇最基本結構,並一再重複使用(附錄1.3)。 這項研究已取得初步的成果,但仍有一些限制。首先,本研究採取質化、主觀描述方式。如前所述,由於我選取了和我志趣相投的主題,也十分熟悉教材的內容,我感覺自己更有動力學習。然而,目前尚不清楚這種學習方是否對我的學習有量化上的意義。通過更長時間的研究和定量分析,如通過口語、書面、閱讀和寫作測試進行長期追蹤,未來可以更仔細分析這項研究是否能帶來更好的語言學習成果。此外,由於這個實驗僅基於我個人的經驗,未來的研究應該納入多位師生的經驗,使用對照組,並衡量這種語言方法是否具有優勢。 此外,參與實驗的教師和我對於對ChatGPT下指令均非常熟練,這使得生成教材和編輯過程更加順利。未來建議研究這種方法是否也適用於不熟悉ChatGPT的教師和學生,也許可以和ChatGPT的預備培訓項目相結合。 另一個限制是,本研究採用的是ChatGPT高資源語言——中文,因此生成的文本質量較高,而資源較少的語言可能不適合用於教科書生成。最後,這項研究是在一對一的課堂環境中進行的,這比L2課堂中每位教師面對多名學生的情況更具個人化的空間。 更重要的是,ChatGPT生成的文本中存在的缺陷—這種L2學習材料方法的一個主要缺點—可能在不久的將來可以得到解決。大多數ChatGPT生成文本中的缺陷是由於缺乏數據輸入和無法正確理解我所下的指令造成的。然而,OpenAI和Google等公司每年都在這些領域取得指數級的進步。這一發展中一個對L2教科書生成特別重要的部分是ChatGPT的上下文窗口大小的發展。一個大型語言模型(LLM)的上下文窗口類似於可處理的短期記憶。OpenAI在2023年初發布的前代GPT模型GPT-3.5 Turbo,其上下文窗口最大為4,096個詞元標記,相當於一篇10頁文章的文件大小。在不到一年的時間裡,OpenAI發布了GPT-4.0,其上下文窗口為8,192個詞元標記。撰寫本文時的最佳模型是GPT-4.0 Turbo,其上下文窗口超過128,000個詞元標記,這意味著這個模型可以有效地在其上下文窗口內檢視一本300頁的書。 假設這些模型的上下文窗口呈現指數級發展,在未來幾年內,ChatGPT將能夠分析並整合中文風格指南、詞彙列表,甚至整個中文語法體系到OpenAI的未來模型中,並要求它在生成文本時遵循這些材料。 通過使用我自己的材料學習,我能夠用中文與華語老師一同發展精彩有趣的課程,如科技倫理、演算法等主題。使用ChatGPT生成這些學習材料,為我提供在學習中文的過程當中,更多自我表達的機會和動力。 在可預見的未來,渴望學習新語言的學生可能會使用LLM工具,利用各種可能的機會生成他們感興趣的材料。隨著LLM準確性的發展和AI整合學習方法的研究,LLM將繼續成為學習新語言最具前瞻性的工具之一。 致謝 我衷心感謝國際華語研習所(ICLP)對此研究項目的全力支持,給予我自由探索的研究機會。特別感謝所長吳雅鳳教授與副所長熊宗慧教授,還有積極參與我研究項目的王楚蓁老師與洪慎杏老師,他們在研究過程中均提供了寶貴的支持。非常感謝王楚蓁老師對本研究提出的L2專業建議,讓本文得以順利完成。 參考文獻 Albdrani, R. N., & AlShargabi, A. A. (2023). Investigating the Effectiveness of ChatGPT for Providing Personalized Learning Experience: A Case Study. International Journal of Advanced Computer Science and Applications, 14(11), 1208-1213. DOI: 10.14569/IJACSA.2023.01411122 Brady, I.K. (2021). Positive Psychology and L2 Motivation in ESP. In: Escobar, L., Ibáñez Moreno, A. (eds) Mediating Specialized Knowledge and L2 Abilities. Palgrave Macmillan, Cham. https://doi.org/10.1007/978-3-030-87476-6_6 Coyle, D. (2008). CLIL: A Pedagogical Approach from the European Perspective. In N. H. Hornberger (Ed.), Encyclopedia of Language and Education (2nd ed., Vol. 4, pp. 1200-1214). Springer-Verlag Berlin.
1.1 新聞 (News Article) 近日,印度孟買市發生了一起引發爭議的事件。有一家叫做甘尼什保險公司推出了一種新型保險方案,這個方案依賴人工智慧來分析個人數據,並利用這些數據來調整保險費用。 據了解,這個方案要求客戶與保險公司分享他們的個人數據,包括飲食習慣、駕駛行為和健康狀況等等。人工智慧系統就可以根據這些數據來評估客戶的健康風險,並調整保險費用。甘尼什保險公司表示,他們這樣做是為了鼓勵人們過更健康的生活,是雙贏的市場策略。 不過,很快就出現第一起引起軒然大波的案例。有一位名叫納亞娜的孟買居民,她愛上了來自貧困地區的薩赫傑,於是她家庭的保險費用大幅增加了。人工智慧系統推斷,因為薩赫傑的社會地位,納亞娜的健康風險增加了。這個事件暴露了人工智慧系統在道德和社會正義方面潛在的問題。 保險專家指出,這是人工智慧根據預設偏見做出判斷的典型例子。我們必須小心處理基於大數據的決策過程,否則可能會加劇社會不平等的現象。納亞娜的案例引起了公眾的廣泛關注,網友紛紛質疑利用個人資料進行風險評估的做法侵犯了個人隱私。 甘尼什保險公司的發言人對此回應說:「我們開發的系統目的是鼓勵人們過健康的生活,並根據風險評估來調整保費。我們正在不斷審視和調整我們的演算法,以確保它們公平無偏見。」但是許多人擔心,基於數據的決策可能無意中擴大了現有的社會鴻溝。社會學者表示,當人工智慧系統將社會經濟地位作為健康風險的一個判斷標準時,低社會經濟背景的人可能會受到更不公平的對待。 這個事件不僅引發了人工智慧技術侵犯個人隱私的爭議,更涉及我們將如何重新定義公平和正義。在人工智慧越來越影響我們生活的今天,找到技術創新和社會倫理之間的平衡迫在眉睫。 1.2 生詞 (Vocabulary List) 印度 (Yìndù) - India 孟買 (Mèngmǎi) - Mumbai 引發 (yǐnfā) - to cause; to trigger 爭議 (zhēngyì) - controversy; dispute 推出 (tuīchū) - to launch; to introduce 新型 (xīnxíng) - new type; novel 保險 (bǎoxiǎn) - insurance 方案 (fāng'àn) - plan; scheme 個人數據 (gèrén shùjù) - personal data 調整 (tiáozhěng) - to adjust 保險費用 (bǎoxiǎn fèiyòng) - insurance costs 共享 (gòngxiǎng) - to share 系統 (xìtǒng) - system 雙贏 (shuāngyíng) - win-win 軒然大波 (xuānrán dàbō) - a great uproar; a big stir 案例 (ànlì) - case 居民 (jūmín) - resident 貧困 (pínkùn) - poverty 暴露 (bàolù) - to expose; to reveal 潛在 (qiánzài) - potential; latent 偏見 (piānjiàn) - prejudice; bias 大數據 (dàshùjù) - big data 加劇 (jiājù) - to aggravate; to intensify 網民 (wǎngmín) - netizen; internet user 質疑 (zhìyí) - to question; to doubt 評估 (pínggū) - assessment 發言人 (fāyánrén) - spokesperson 審視 (shěnshì) - to examine; to scrutinize 無偏見 (wúpiānjiàn) - unbiased; impartial 擴大 (kuòdà) - to expand; to enlarge 社會鴻溝 (shèhuì hónggōu) - social gap; social divide 判斷標準 (pànduàn biāozhǔn) - judgment criterion 對待 (duìdài) - to treat; treatment 不公平 (bù gōngpíng) - unfair; unjust 涉及 (shèjí) - to involve; to relate to 重新定義 (chóngxīn dìngyì) - to redefine 正義 (zhèngyì) - justice 1.3 語法結構 (Grammar Patterns List) "…基於…的…" (…jīyú…de…) 定義:表示某事物是基於或基於某種原則或元素。 Example: 這篇論文基於實驗數據的分析,提出了新理論。 (This paper, based on the analysis of experimental data, proposes a new theory.) "…典型例子" (…diǎnxíng lìzi) 定義:指某事物的典型或經典例子。 Example: 他的成功故事是努力奮鬥的典型例子。 (His success story is a typical example of hard work paying off.) "…根據…來…" (…gēnjù…lái…) 定義:表示根據特定標準或資訊做某事。 Example: 教師根據學生的表現來調整教學方法。 (The teacher adjusts the teaching methods based on the students' performance.) "…引起軒然大波" (…yǐnqǐ xuānrándàbō) 釋義:指引起轟動或騷動的意思。 Example: 這個政府決策引起軒然大波,民眾反應強烈。 (This government decision caused a great stir, with strong public reaction.) 1.4 討論 (Discussion Questions) 像 Ganesh Insurance 這樣的公司提供經濟誘因來換取個人數據,即使它促進了更健康的生活方式,在道德上是否合理?這種做法的潛在風險和好處是什麼? 人工智慧是否應該有權利做出對人類生活產生重大影響的決策,例如根據生活方式選擇改變保險費?應該採取哪些保障措施? 人工智慧根據社會經濟地位做出改變生活的決定在道德上是否可以接受,就像納亞娜和她的伴侶的例子一樣?是否有一種情況可以證明這是合理的? 在個人資料隱私與社會利益的爭論中,個人權利是否應該始終高於公共利益?特別是在健康保險等個人選擇可能產生更廣泛社會影響的情況下,你的界線在哪裡?