「自然語言處理」是什麼?
根據WIKI對自然語言處理的定義,自然語言處理(英語:natural language processing,縮寫作 NLP)是人工智慧和語言學領域的分支學科。此領域探討如何處理及運用自然語言;自然語言認知則是指讓電腦「懂」人類的語言。自然語言生成系統把計算機數據轉化為自然語言。自然語言理解系統把自然語言轉化為計算機程序更易於處理的形式。
Linggle的使命和技術簡介
Linggle是清大資工系張俊盛教授的科技部研究計畫開發出來的一個雛形系統,提供各界免費使用,目前一天最高流量達到五千人次,對象包含台灣學生跟英文老師,美國跟中國的使用者也不少。Linggle可以用 Windows 或蘋果 Mac OS 瀏覽器(Chrome, Safari但不要用 IE),目前Microsoft Word增益集已經開發成功正在申請上架,Ggoogle docs的增益集還在準備中,在不久的將來使用Linggle學英文寫作,會是一件很方便的事。
Linggle的使命在於支援英文寫作上文法和用字問題的查詢,並協助學習者自主編輯文章。Linggle 的技術是支援關鍵詞、不確定詞的查詢,並利用查詢結果顯示文法和用字問題的答案。搜尋結果(回傳資料)是按頻率由高到低排列,頻率高者常常是答案,頻率低則傾向是錯誤或非常見的用法。
我們如何藉由Linggle增進英文寫作的學習,最重要是提高學生對錯誤的危機意識,讓學生經由主動偵錯進一步有意願、能力想要自主編輯文章內容,透過自主學習得到的經驗會是最深刻也會是最寶貴。
Linggle目前主要協助英文寫作低層次部分,比起利用辭典跟文法書作為寫作工具,目前電腦(Linggle)可以很有效地幫助文法、用字困擾。但Linggle目前無法有效協助英文寫作高層次的部分(例如語意修辭、段落邏輯與文章故事結構),唯有Linggle跟英語教師互相搭配,讓Linggle有效率解決低層次的問題,老師便有時間教導高層次的英文寫作技巧。
Linggle自學攻略
劍橋大學的語料庫研究整理發現一共有15種常見的用字錯誤型態,Linggle經過反覆驗證確定都能檢查出這些常見錯誤,包含動、名、形、介詞誤用,冠詞、介詞冗餘或缺漏等,動詞型態、名詞單複數等。(使用說明請見http://linggle.com/)
舉例:我們在學習英文上,很多人會搞不清楚適當的冠詞、單複數的變化和介系詞的使用方式、動詞和名詞的組合,Linggle的技術是如何協助我們克服在英文使用上的弱點?
- 適當的冠詞:用 ? 表達有、無:如 ?a;用 / 表達取捨 a/the
- 單複數的變化:用 / 表達取捨 noodle/noodles
- 介系詞的使用方式:用不確定之詞類查詢 prep. 或 ?prep.
- 動詞和名詞的組合:v. higher education, ~accept higher education
Linggle的應用和未來發展
任何系統取代英語教師,僅僅是個夢想而已,現在完全不可能,正確的路徑應該朝向幫助教學、自學利器來發展。目前透過語言中心、圖書館的宣傳,正在推廣個人如何使用Linggle。同時間也和語言中心、英語老師合作,加強混成教學(blended teaching)的教學研究經驗,將Linggle的開發更符合使用者經驗。
來賓介紹
清華大學資訊工程學系 張俊盛教授,領導研究團隊研發語言學習搜尋引擎Linggle,已經成為國內研究生攥寫英文論文的必備工具,並且受到知名電腦資訊部落客推薦,清大Linggle的功能比起德國包浩斯大學開發的NetSpeak也更加強大,目前張教授帶領更大的跨領域研究團隊,正在擴大Linggle的功能,目的是形成一套多功能系統,將造福更多英文學習者。