2023年春,清晨的斯坦福大学校园,很安静,好未来创始人张邦鑫,约上CTO田密,一起散步。
二人心事重重,气氛有点严肃。张邦鑫一开口,直入主题:“能不能请你放下别的所有工作,只做大模型?”
那时,ChatGPT发布已有数月,张邦鑫第一时间关注,部署了非正式预研,没拿定主意要不要跟进。
他带着团队专程赴美,考察大模型的进展。
一周多时间,团队连轴转,英伟达、谷歌等巨头以及Figure这样的初创公司,一口气走了个遍。白天出门,夜里复盘讨论。
地陪司机忍不住嘀咕:“别人都是去哪儿玩,去哪儿看show,你们公司一天安排六七个访问行程,也太拼了。”
“走完一圈,挺受震撼,我们意识到,AI将给教育带来巨大颠覆。”田密接受《21CBR》记者专访时表示。
那场清晨对话的最后,田密立下军令状——如果大模型做失败了,就离开公司。
他带着几十人的队伍,埋头攻坚,半年时间,自研发布数学大模型MathGPT,后取名为“九章”。
“九章”在数学科目尤其出众,2024年权威的MathEval数学能力测评中,位列国内外数十个大模型榜首,且深度应用到学习机等核心产品。
据刚披露的财报,3-5月,好未来净收入同比增长39%,AI驱动的智能硬件业务,成为重要主力。到7月末,好未来市值约480亿元人民币。
今年,田密团队开始推动大模型走进公立学校,第一版产品“九章爱学大小屏”,已在全国四个省市试点。
“AI老师,是好未来坚定要做的方向。”田密希望,真人老师能干的事,未来AI老师都能干,且干得更好。
以下为田密自述,经编辑整理:
押注“九章”
2022年11月底,ChatGPT问世,我们第一时间开通账号,用完以后,大家很惊叹。
过完春节就发现,身边讨论的人越来越多,产品已经破圈。邦鑫和我们几个人,一直在讨论,要不要跟进。
当时还没买新卡,就用手头一批英伟达V100卡,做了些预研测试。
大家觉得,还得去发源地看看,去美国一考察,感受很深刻,技术革命来了,好未来必须all in,全力投入大模型。
带着几十人的团队,我重新回到一线攻坚状态。
大模型要顺利起步,三要素的投入不能少,算力、算法人员、数据,都以亿为单位,很烧钱,成本投入是首要问题。
幸运的是,老板的决心很大。
起初我想过,租一批大厂的卡训练。邦鑫建议,自己买卡比较可控,在教育公司里,好未来的算力投入可能最大。
算法的关键在于人。当时,集团算法人员大约有100多个,几乎全部抽调来做大模型。
好未来已积累大量教育数据,而做模型的强化和微调,光有教育垂类数据不够。我们又专门建了一个基地,雇人做数据标注。
最初,团队打算从零开始,训练一个自己的大模型。后来,优秀的开源模型不断涌现,自己做预训练,不划算。
我们果断切换方向,基于DeepSeek、LLaMA等开源模型,结合学而思独有的教育数据,进行二次训练,再用多个模型进行交叉验证和投票,得到专业的教育大模型。
站在巨人肩膀上,模型能力大幅提升。
数学是大模型应用最具挑战的领域之一。做大模型的厂商很多,从数学切入的,只有好未来。
好未来做数学培训起家,积累很多,2017年就成立AI Lab,有传统AI打下的地基,过渡下来,过程很顺。
我们花了半年,做出了MathGPT第一版,2023年11月,MathGPT成为首批通过备案的教育大模型。
“九章”这个名字,源自《九章算术》,是世界上最早的印刷本数学书。“九章”好听好记且有故事,大家取名没有纠结,一致通过。
传统AI时代,针对多个应用场景,我们要用到上百个小模型,好未来就开发了大量AI助手,协助老师备课、批改作业等,功能较为零散、简单。
现在,一个大模型能搞定很多事。
更重要的变化在于,AI能力正逐步强大,能实现教、学、练的闭环,从过去以老师为中心,真正转向以学生为中心。
软硬结合
做大模型不是炫技,帮用户解决现实问题,才是第一位的。
九章大模型以数学起家,已将能力延伸到全学段、全学科。
比如,语文学科,提供作文辅导写作、作文批改等功能;英语学科,提供英语作文批改、口语对话练习等功能。
最早,团队从AI解题这项能力做起,我们很快意识到,这不是实际痛点。家长要的是AI能给孩子批改作业,把错题讲明白,减少他们辅导作业的工作量,降低请家教的成本。
九章就选择聚焦三个方向——批改、讲题、精准练。
传统AI,只能批改选择题、判断题等简单题型;一有大模型,不光支持所有题型,且在批改过程中,能指出答题错在哪步,具体关联哪个知识点。
至于讲题,好未来会实打实训练AI老师,划分6个维度的指标,由真人老师打分,评价其讲题的逻辑性、过程的连贯性等。
所谓精准练,基于知识图谱,从孩子做对或做错一道题,AI可判断其是否掌握知识点,精准推送孩子需要的题目。
这些技术能力,正以多种应用方式落地,既嵌入好未来现有的APP、智能硬件和学习服务,也有独立的APP和小程序“九章爱学”,并提供API和智能体接口。
我们也逐渐认清一个现实:纯AI软件很难单独落地,软硬结合可能是现在唯一的出路。
在教育硬件,学习机的复杂程度又最高。
2023年2月,好未来推出第一代学而思学习机,定价4000多元,锚定“好内容”,当时有人估算,仅内置的课程资源,至少等于30万元的培训费。
到第二代产品,大模型能力接入,升级为“好内容+好AI”,“好AI”即九章与DeepSeek形成的双核大模型,强化学习机的智能交互与精准分析能力。
今年5月,我们又发布旗舰产品T系列,搭载小思智慧岛Pro,这是个软硬一体化的摄像头体系。学生伏在桌上写作业,摄像头能直接拍到纸上题目,可智能提供作业辅导。
我们正在努力,往多模态AI老师的方向进化,省去每次主动唤醒AI的动作,这样,桌面放上教科书或试卷,学生手写时,摄像头实时查看,实时按步骤讲解,如同真人老师面对面辅导。
配合学习机等硬件的更新,九章大模型的AI能力,也保持以月为单位的迭代节奏。
提速进化
我们已开启AI产品进校业务,2024年底立项,今年3月推出第一版To G的学习机。
第一批试点,已有三个月时间。
据学校反馈,两个班级对比,有AI工具赋能的班级,数学成绩的均分,较另一个班高出7分,预测学期末将拉开十几分的差距。
AI进校,有个逐渐接受的过程,关键在于信任和效果,我们有耐心,也有信心。
我们内部,也在锻造AI化组织。
一是转变思路,业务遇到问题,先问大模型,能不能做、怎么做;二是工作内容的“AI率”提升。
内部明确要求,未来数月,至少有某项工作由AI替代,如法务、财务的合同审核,基本交给大模型,大幅提效。
核心技术路线上,好未来会坚定走向“AI老师”。如同无人驾驶等级的L0到L5,教育行业的AI老师,大体也是如此进阶。
L1级别,AI只能打辅助,做些简单重复的工作。
当前所处的L2,AI能胜任某个模块,比如作业批改,属于“辅助驾驶”阶段,老师可以“脱手”“脱脚”,不能“脱眼”。
L3级别,进入“有条件的无人驾驶”,可部分“脱眼”,不能“脱脑”。我们希望,未来两三年能实现L3。
比如,家庭场景下,学习平板里的AI老师,可自主帮忙完成学业规划,也能实现做题-批改-讲题-练题的完整闭环。
一旦到L4级别,AI老师可跨场景切换,家长能放心把孩子的学习交给AI,除非出现个别极端情况,基本不用接管。
那时,教育业将迎来彻底变革。
我入局大模型两年,感到压力最大的,是刚接下任务时,一切未知,不知从何着手。
现在心里踏实多了,应对挑战的方法论,也很明确:从用户使用过程和经验中发现不足,思考技术改进的路径,探讨更丰富的交互形态。
就个人而言,之前十几年,待在腾讯、阿里,花名一直是“老师”。或许,冥冥之中就已确定我的角色。
正版炒股软件提示:文章来自网络,不代表本站观点。