学霸君研发的高考机器人 Aidam
6月7日,学霸君研发的高考机器人 Aidam 挑战全国卷二文科数学卷,用时 9 分 47 秒,取得 134 分的成绩(满分 150 分),表现非常惊艳。
在拥有了如此亮眼成绩之后,AI 未来到底是霸权力量还是水和电这样的基础设施?学霸君在拥有了挑战高考的 AI 能力之后,是否愿意把 Aidam 的技术算力开放给教育行业呢?
在完成了 AI 高考的当晚,学霸君创始人张凯磊在第一时间接受了蓝象的独家专访,表示将逐渐把手写识别的能力、自动解题能力、自动批改能力开放出来,支持更多创业者进入教育科技领域。
作为蓝象营的行业顾问,张凯磊尤其强调到,未来学霸君的所有合作都会通过蓝象资本开放。教育行业未来的发展需要技术、认知与资本的增量与共享。蓝象资本也将与学霸君一起,为行业提供底层发展所需要的 AI 算法与算力、资本加速、行业认知与资源。
以下为部分分享干货整理:
1、这次 Aidam 的失分点在哪里?
张凯磊:失分点一个是没有理解题目,一个是超出了系统可以理解的范围。计算机还是有很多缺陷的,他有时不能理解题目本身是什么,有时不能紧紧抓住信息重点,难以把握题目的要旨。
2、Aidam 如何读试卷?Aidam 解题的步骤是什么样的?
张凯磊:读试卷的关键点是把自然语言翻译成机器能理解的形式语言。这个是非常难、很具有挑战性的事情。假设一段语言包含一千维度的熵,这个熵是最小维度的信息。机器真正需要做的事情是把里面有效的熵传递出去,而把无效的熵省略。这个非常的难。
准确传递信息是整个技术期里面最难的部分之一,需要不多一毫,不少一丝。
学霸君用的是 SVO 模型,当 SVO 模型工作的时候,就是在传递一个最小可用的信息模型。传递过后再进行符号计算和逻辑推理。我们向计算机内输入公理、定理,跟经典题目形成一系列的计算规则。然后快速做搜索,穷尽计算规则,看它能不能解出来。这两部分是计算机相对而言比较擅长的。最后,它会把形式语言变成自然语言输出,让人能读懂步骤。
简单而言包含三个步骤:自然语言翻译成形式语言,形式语言做逻辑计算,逻辑计算翻译成自然语言。这是自动解题的核心逻辑。
3、从算法来说 Aidam 用了多少数据训练,这需要多大的计算量呢?
张凯磊:我们有400台至强十二核 64G 内存的服务器加上1000台左右的辅助服务器,这400台基本都是 Tesla,容量很大。一个Aidam 的背后大概有7个引擎,代数和几何使用的是完全不同的引擎,从算法、逻辑到推理全都不一样,技术上难度很大。
数学公式非常重要的是需要翻译成 LaTex ,通过 LaTex 进行阅读理解和输出。Aidam 每天训练30万道到50万道题目, 训练时间基本是全天的。但是因为白天有大量的中断性测试,所以晚上训练的时间更长。
4、这次 Aidam 是参加数学考试的,当初我们为什么选择数学?如果语文、英语等科目考试,预计可以考多少分?
张凯磊:一千个人眼里有一千个哈姆雷特,但是这个世界上只有一个勾股定理。如果今天做一个语文赏析,这道题目要评3分还是8分,都是有争议的。但是数学的逻辑很清晰,对就是对,错就是错,很难有一个随意改变分数的场景,比较公正。
我们在语文和英语方面有积累,但是因为瞄准的目标是数理化,文科方面还比较弱。按照之前的测试结果,语文跟英语只有不到一百分的水平。
5、Aidam 参加高考对学霸君的意义是什么?
张凯磊:我们希望通过这个活动告诉业界,今天的人工智能已经做到一种什么程度了。他能不能做自动解题,能不能做自动批改,能不能做自动推荐。
高考机器人是人工智能在教育领域的一个枢纽点,它模仿人脑的感知、记忆、认知、分析、建立经验知识库、联想、判断、决策,还结合了跨学科、跨领域的知识研究,一旦做好之后,用机器人进行判题、个性化指导、学生管理、家校沟通、教案改进都变成可能。
6、自动批改对于客观题很好理解,但是主观题中每个人的字迹都不同,机器的手写识别能力如何呢?
目前我们在手写识别方面识别率已经超过 98.7%,建立了超过7万人左右的个性化书写库,到达了接近于商业可用的程度。
7、Aidam 能够胜任一些更高难度的数学问题甚至数学界的一些前沿问题吗?
张凯磊:没有办法做到更前沿的问题。它是在一个有限额范围内的搜索行为,并不能协助人类去探索更多的东西,这是今天的机器还不能做到的事情。
8、蓝象资本专注投资教育早期项目。您作为蓝象资本的行业顾问,会以某种形式开放计算能力,与教育行业内的创业者一起合作吗?
张凯磊:会的。我们会逐渐把手写识别的能力、自动解题能力、自动批改能力开放出来,欢迎更多的人来做这些事情。今年我们与皖新传媒合作,能够铺很多班级,积累出大量数据。
学霸君在 OCR 层面已经做了大量的事情,未来还会持续做。我们希望自己可以成为全球范围内真正把 OCR,包括印刷体、手写体做到顶尖水平的载体。
本文转载自蓝象营。
来源:蓝象营