(图片来源:pixabay)
人工智能是指由人工制造出来的系统可以对信息输入自动做出判断,与回应有意义的输出或行动。人工学习系统目前可以对写作提供怎样的自动化协助呢?以下是一些实例。
Quill
这是个协助老师为学生进行英文写作活动的工具,每个活动不超过十分钟,包括文句建构(Combining Sentences)、校对错误(Proofreading)、文法练习、弱点诊断,最重要的是学生在送出答案后会立即得到反馈,系统会自动针对学生错误,动态建议下一个适合的活动或问题给学生,系统自动批改练习后,提供学生、老师仪表板显示学习历程,方便老师立即采取行动帮助需要协助的学生,提供差异化教学。
内容对齐美国中小学学习标准Common Core State Standard。它背后有数个创投与企业支持,包括Google 与比尔盖兹基金会,使它可以免费提供系统给老师学生使用。
NoRedInk
NoRedInk的产品与目标用户与Quill相似,但是加上一些有趣的元素提升学生兴趣,即时反馈、重覆练习与个人化学习内容是这种产品的诉求,它提供更多功能作为付费版本。其实老师与家长都可以自行使用以上两个产品的免费版本,NoRedInk的免费版就已经有适性(Adaptive)学习功能了 (我们没亲自试过) 。
这是一个由老师创业,获得创投支持的专案,相信它会相当掌握学校与教育工作者的需求(美国)。但是,也有新创公司的问题,小团队人力有限,可能无法支持客制化需求。
建议参考这个非营利网站的评价,Quill的评价高于NoRedInk,也可再看看老师反映的使用感想为何。
Grammarly
这个工具让你安装一个Add-On 在浏览器上,当你写任何英文文字时,它就开始运作。免费版已经可以自动帮你核对文法、标点符号、拼字,进阶功能(付费版) 还有检查句子结构正确性、调整写作风格以符合指定文体(Genre)、检查是否抄袭(Plagiarism)、与改善字汇选择。它会提供建议与解释,但让使用者自己决定是否接受建议修改,你可以选择英国或美国的英文用法。
中国大陆的英文作文自动批改工具会将长的英文句子评定为高分,但是Grammarly 会建议你将长句子拆解成较短的句子,符合真正英语使用者的习惯。它甚至会警告你同一个英文字使用太多次了,进而建议你可以采用的同义字。它也能检查出某段文字是否抄袭自网路上某个来源(含下载的PDF 档案),还顺便建议如何改善这段文字与字汇。
告诉Grammarly 你在写的是何种文体(eg “research proposal" 或“business letter" 或“end-user assistance" 或“technical writing" 等等),同一段文字会得到不同建议,等于一面写一面学习,是个非常有效的写作效能支持工具,我建议各位亲自测试看看。根据网路上众多使用者评论,它并非完美,但是大部分情形都令人满意,通常我们无法有人帮忙检查文字正确性,这个工具的即时反馈非常有用。
其实类似Grammarly的工具还有其他,例如Ginger,请参考这篇文章介绍,也欢迎读者提供测试比较心得。
TurnItIn
TurnItIn 几年前推出时,主打帮老师检查学生作业是否抄袭,所以这功能是强项,而现在它也增加了协助写作的功能。它的二项主要模组,Revision Assistant 宣称在学生写稿修订的过程给予建议,而Feedback Studio 让老师或同侪对文字进行批阅、评注、评分。目前许多师生利用免费的Google 文件可以加评论与互相反馈,TurnItIn 只是强化版而已。
看起来它的特殊优势还是在检查抄袭,其他比不上Grammarly。它的主要客户是教育机构,透过学校订购学生才能使用,没有免费版本。而Grammarly 比较有弹性,个人可以免费或订购使用,机构也可团体订购。目前两者都有一定的教育机构使用基础。
OpenEssayist
这是一个英国开放大学的学习分析研究发展专案,利用自然语言处理技术(Natural Language Processing, NLP)对文字进行文义摘要(Extractive Summarization Using Graph-Based Ranking Algorithms)与形成性评量,为撰写论说文(Essay)的大学生提供支援。
它对你的论文提出重点摘要,让你反省这是不是你要表达的意义,它主要对文章结构、关键字、关键词、关键句子进行分析总结,搭配可视化图表,自动回馈给学生反思。
Linggle
Linggle是由台湾清华大学的自然语言处理实验室所研发,十分实用,进入网站后如何使用一目了然,在此就不赘述。根据清华大学廖伯森校教授的著书指出,Linggle系统是少数学界开发Data-Intensive Language Learning的范例(简言之,利用大数据优势建立的系统),规模逼近业界搜寻引擎规模。
2008年开发的Linggle系统( Linguistic Search Engine) 使用更大的Google Web 1T 5-gram资料(一兆词网页资料1到5连字的统计资料)。过程中过滤其中的错字,并巧妙地加注词性,可以支援创新的「任意词性+关键词」搜寻方式。例如,在Linggle上查询“ ADJ beach "可以学习超过1,000笔“ beach "的搭配形容词。如果查询role这个单字的用法,可以得知最常配合的动词是play,形容词是important,介词是in。到了2010 年纽西兰的University of Waikado也开发出Greenstone Project系统,功能更加完整。
另外廖教授也介绍了能在学习者的写作中侦测错误,提供建议或评分的工具,如清华大学的MUST雏形系统。根据最近的一份研究报告《Automated Grammatical Error Detection for Language Learners》指出,MUST是目前动词侦错效果最好的系统。
Writefull
Writefull 完全免费。它是个十分有趣的专案,也是前述Data-Intensive Language Learning 的一个范例。它从巨量资料里搜寻英文文字的建议用法,资料库含Google Books、Google Web、Google Scholar、 Google News,简言之,如果世界上最大的资料库统计出来英文这么被使用,像是众集智慧,那这个建议一定有参考价值。
使用方式也是安装一个Add-On 在浏览器上,你可以在英文写作时,圈选某个词汇、句子,然后按下快捷键呼叫Writefull ,请它帮你检查这个用语在书籍、论文、网路上的使用次数,这可以帮你确认这是不是通用的语法;或者可以帮你比较两种用语的使用频率,尤其你可以在Google 图书或研究中做比较,看看论文书籍上通常使用哪种语法;也可以问它句子中的某个空格该填什么字,提供建议可以替换的同义字以避免重覆使用同一个字汇,还有,念英文出来给你听。
WriteLab
WriteLab成立于2013年,以筹资历史来看也是个迷你的新公司,宣称结合NLP与Machine Learning对文章进行分析,参考前人介绍 :
三种运用场景:
学生上传文章或直接在Writelab 平台写文章,Writelab 会自动从字词的选择、重点、结构、清晰度、连贯性和基调等几个角度分析文章存在的问题,并提供修改意见。
学生也可以通过Writelab 平台将文章分享给老师或其他学生,以便获得更多反馈意见。
在学生多次使用Writelab 之后,平台会对学生的多篇文章进行统计分析,识别学生的不良写作习惯,并针对如何提高学生的写作水平提供指导。
目前Writelab 采用免费增值的收费模式,基本服务是免费的。这公司的新闻多仅止于关于创投投资的报导,笔者认为从它的网站流量跟Grammarly 比起来,实在是小巫见大巫。用户数可以吹牛,但是网站流量很难作假。
作文自动批改的发展由来已久
像WriteLab 这种作文批改工具并非新鲜事,有许多资深专案,Power4Edu 也对于类似工具做了一个回顾:
国外对作文自动评分的研究最早可以追溯到1960 年代。目前比较知名的作文自动评分产品有ETS (美国教育考试服务中心) 开发的eRater (或E-Rater)、Vantage Learning 开发的Intellimetric、Measurement, Inc. 开发的Project Essay Grade、Pearson 开发的Intelligent Essay Assessor ( IEA)、PaperRater 等。知名MOOC 平台EDX 也在开发自己的增强型智能评分引擎(EASE)。eRater和Intelligent Essay Assessor (IEA) 都是在上世纪90年代就推出的产品。但直到现在国外教育市场上仍有对于此类产品评分结果的准确性表示质疑和担心的声音存在。
大型线上课程(MOOCS) 的教学者常碰到「如何批改上千份作业」的问题。亚历桑纳州立大学(Arizona State University) 去年(2016) 也宣布与比尔盖兹成立的Big History Project 合作,探索用自然语言处理技术来自动批改论说文(Essay)。
自动批改作文是个困难的人工智能课题,有兴趣钻研的读者不难找到相关论文;主要可以分两个层次来说明,第一层是核对已知规则与最佳实务,理论上这部分人工智能应该可以胜任。其实本文提到的工具都属于这层,产品技术功力高低是一个重要考量,问题是这种系统像个非常复杂的黑盒子,可信度是个问题,怎么知道黑盒子里是否有不合理的规则或Bug?所以越多人(尤其是英文老师)使用过评估而认可,越值得采用,而这些比较多人认可的系统通常也经过比较长时间的优化了。第二层是文章的品质评量,包括逻辑推演与文艺价值,这就需要人类的高阶思考能力或感性认知,笔者认为目前这是不可能用人工系统来判读的。
有人或许对于人工系统取代老师改作文不以为然,其实英文老师应该相当感谢可以代劳处理第一层的系统,它让老师能从繁重的改错字、改标点符号、改文法这些琐碎工作中解脱出来,把时间花在学习活动设计与上述第二层的文章创作评量— 无法被电脑取代— 的工作上;对学生而言,电脑系统可以立即提供反馈,效率当然比等老师批改后才得到反馈高多了,而且数位历程记录的保留运用有助学习的持续提升。
本文出自数位学习无国界(chinese.classroom-aid.com),由Classroom Aid 团队所建立,开放授权条件CC BY-NC-SA。
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。