明天就是2026年的除夕!终于,经过2个月近乎7×20小时的努力,系统更新了200多次,为1000位不同类型的邀测用户消耗了20亿Token——终于在这个春节前,我们可以官宣这个节点:格灵阅读正式进入3.0 AI时代。
其实格灵阅读3.0从1月就已经开始大部分功能正式上线,目前依旧保持着几乎日更的节奏,这个春节无休,团队会依旧马不停蹄。
格灵阅读源于11年前我带的一个内创孵化项目。那几年间,它经历过多个商业版本的反复试错,最终在2020年5月11日迎来1.0版本上线。2022年我写的那篇《格灵阅读1岁半了,8年思考与实践,不忘初心,砥砺前行!》,算是我对团队交付的一张"战略承诺书"——我们要在AI、中文分级阅读、专业阅读测评这三件事上死磕到底。随后的几年我们在ToB/ToG/ToC/ToB2C多市场上接受考验。经历双减震荡,穿越社会环境巨变,但主线从未偏移。如今,格灵阅读已经成为客户口中、市场推荐、行业认可的"最专业的中文分级阅读测评服务商",可提供私域部署、OEM、竞赛/万人测评、模考服务、单校&集团校服务、区域代理、教培合作、出版融合八种成熟的合作模式。
甚至让我们的服务专业度被客户称为"只此一家"的程度。这背后,是我们做对了三件反常识的事:
第一件事:我们用11年,建了一套"能落地"的中文分级阅读知识工程
11年前,我们走访全国,总结的理论成果只能汇到一张纸,更别提可工程化、可计算、可应用、可迭代的知识体系。于是我们只能从0到1自己干,把散落在课标、教材、行业理论、国际测评标准(蓝思、PIRLS、PISA)、论文中的阅读知识,转化为结构化的知识图谱+精细化难度分级体系。
这有多难?它要求同时懂教育、懂阅读、懂语言学、认知科学、教育测量学、工程架构、AI、技术开发的混合和专有人才共同去做这件极为创新没有参考的事——既要让专家认可其专业性,又要让AI能理解其逻辑,更要落地到技术研发和产品实现中。
没有这些工作,无论是内容难度识别划分、还是能力测评评估都没有任何的支撑点和抓手去实现。我们庆幸这些年巨大的投入没有白费,如今,这套体系已进化至第5代,从最初覆盖小学的24级,扩展至贯通K12的48级分级标准,完全嵌入系统底层。今年,我们也将抓紧通过API开放这个能力。
第二件事:主动"放弃多元化",把阅读测评做到"一米宽,万米深"
做格灵之前,我们几乎试过所有与阅读相关的变现模式。客户想要的,以我们团队在互联网和教育领域10多年的积累,我们都能做,我们本可以做很多"来钱更快"的模式,但我们选择了拒绝。
这个决策让我们在最难啃最专业的公立校、教育教研主管部门、出版行业反而率先获得了深度信任。深度的代价是时间,时间的复利是壁垒。
第三件事:我们把AI从"功能插件"进化为"系统底座"
2020年前,市面上的阅读推荐依赖"专家规则"——由人的认知和知识来推荐内容和判定人的能力。这就出现了一个典型的现象,两位泰斗级专家的理念冲突时,产品该听谁的?
我当时的判断是:任何个人的知识上限,都锁死了产品的天花板。所以我们选择了一条更难的路:把人类专家的知识"原子化",让AI在语义理解、难度校准、能力归因三个维度上自主决策,因为AI的能力是没有上限的,随着它的进步,效果只会越来越好。
早期的AI远没有现在强大,格灵最初的AI还是基于NLP+LSTM做模式匹配和统计预测,不但效果有限,并且由于这个领域也不是热门领域,我们只能合作拿到一些通用的语料库,还得自建语料库。
大模型时代到来后,当别人开始"接入AI",而我们完成了"重构底层"——如今的格灵3.0,不但可以完美继续精准提供2.0的稳定服务模式,还可以同时驾驭3.0的创新模式,这种"双轮模式"90%以上的业务逻辑由AI驱动完成,最重要的是这个效率提速了几千倍。
关于"0销售"的副作用与解药
格灵团队基因,是完全0销售、0推广的异类。我们客户均来自口碑转介绍或合作伙伴导流,甚至大部分都是主动找过来。这让我们错过了很多"快钱",但也倒逼我们把所有精力押注在产品本身。比如我作为CEO,既主掌战略、产品、技术还深度参与教研,也是一个超重度的AI builder——在AI开发平台上连续3个月满勤,拿下"满勤码神"、"赛博修仙大师"、"智能体饲养员"这些看似中二的徽章,实则是为了保持对技术前沿的肌肉记忆。这种"不务正业"的热爱让我们每一次的预判都精准猜中节奏:从早期AI阅读,到大模型重构业务适配,再到2025年初就预测AI大模型的下一个阶段Agent落地,并在如今这个节点,构建完成系统底座,并实现多Agent去实现上层的模块化服务,以及驾驭多种合作服务模式,还可以紧密拥抱更强的大模型,只要模型能力越强,我们的服务表现可能也就越佳。
3.0发生了什么?从"工具"到"专家"的质变
接下来,让我们看看这个"养了11年的孩子",究竟发生了哪些变化。如果说2.0时代我们交付的是一把精密的标尺(标准、稳定、可度量),那么3.0时代我们交付的是一位永不下班的AI阅读导师(灵活、洞察、可对话)。这不仅是功能的迭代,而是产品哲学的三重跃迁:
第一重跃迁:从"标准流程"到"非标准对话"
过去十年,教育科技产品都困在同一个范式里:预设规则→匹配内容→标准交互。就像一条精密的生产线:创作内容→选择内容→推送内容→用户匹配→交互完成。用户只能在既定轨道内选择A或B,系统做的是"筛选"而非"创造"。
3.0彻底打破了这个流水线。
我们重构了三端系统的底层架构,建立了一个"AI系统底座"——它首先理解用户是谁(认知水平、兴趣图谱、近期错题模式),然后主动发起对话,在用户提出个性化需求("我的数学和物理知识比较薄弱,你能帮我加强这方面的阅读知识和能力吗?")的瞬间,即时生成专属内容并展开深度交互。
这不是简单的"推荐",而是"因材施教"的终极落地:从"人适应系统"变成"系统适应人",从"标准答案的追逐"变成"思维过程的共建"。
第二重跃迁:从"辅助记录"到"智能决策"
2.0时代的学情系统,我们强调"健壮"——30多种分析数据,数据全,记录准,分析多维又科学,但本质仍是"事后诸葛亮":先发生学习行为,再记录数据,最后生成报告。
3.0让AI直接介入决策链。在学生端,您会看到学习顾问Agent实时工作:它不再只是展示7维能力雷达图,而是基于当前答题轨迹,预判您下一步可能的知识盲区,动态调整路径。就像一位经验丰富的特级教师,在您卡壳前就已经准备好scaffolding(支架)。
在管理端,阅读教练Agent与错题归因Agent协同作战:前者通过自然语言对话深度解析学生48级分级知识掌握情况并给出指导,后者不仅分析"错在哪",更能预测"将在哪犯错"。系统从数据看板进化为"智能参谋",直接参与教学策略制定。
第三重跃迁:Agent集群的"协同智能"
很多人会问:3.0的AI和市面上的豆包、ChatGPT等大模型接入有何不同?答案是:我们不是调用一个通用对话模型,而是编排了一个基于双知识库的Agent集群——在分级阅读和阅读测评这件事上,它是专家,而非通才。通用大模型拥有海量公有知识,但它缺乏两样核心资产:第一,格灵11年积累的48级中文分级阅读私有知识库(结构化知识图谱+精细化难度标注);第二,超3000万次真实测评行为形成的领域认知模式。3.0的架构精髓在于"双库融合":Agent集群同时调用私有知识库(精准定义"难度17"的文本特征、七维能力的测评锚点、历年易错知识点分布)与公有知识库(跨学科知识、语言理解能力、逻辑推理能力),并在"阅读教育"这一垂直领域进行深度融合。这不是简单的"RAG(检索增强生成)"——而是"知识增强决策"。举个例子:当学生问一道主观题时,通用模型可能给出一个看似合理但偏离教学大纲的回答;而我们的意图识别Agent会首先在私有知识库中定位该生的能力段位(如"分析概括-归纳"能力-Level 13),内容生成Agent则基于48级标准即时创作符合其最近发展区的引导提示,评测Agent再依据格灵CGR的评分标准(而非通用语义相似度)评估回答质量。背后还有OpenClaw监听技术支撑的学习教练Agent实时工作:比如相比格灵2.0的音素级评分,3.0它能精准捕捉"春"字声调偏差或语速异常,进行实时提醒和纠音——这不是通用ASR(语音识别)能做到的细粒度专业反馈。通才解决"能不能读",专家解决"怎么读对、怎么读深"。这才是3.0与市面上简单"大模型套壳"产品的本质区分。
这些Agent共享一个"记忆层"(Memory Layer),彼此通气,而非孤立运作。这才是真正的"AI驱动的阅读测评专家"。
关于"主观题"和开放性答案,这可能是一场教育哲学
做阅读很尴尬的一件事,就是它总是有标准答案。我9岁上四年级的儿子,一直以来各科都是全优,但是进了四年级阅读理解开始丢分,因为他的答案"总是让人匪夷所思"——并非逻辑不通,而是不符合"标准套路"。
我只能告诉他:"最高的境界就是你虽然有你的想法和答案,但是你能预料出题人想要的答案,这才是最牛的。"然后,他的阅读理解果然好多了,这让我既欣慰又悲哀。
3.0终于让我能给他一个更好的答案。我们的主观题评测Agent不再寻找"唯一解",而是评估答案的逻辑自洽性、文本依据充分度与思维创新性。系统会反馈:"你的观点很有独创性,如果能结合文中第三段的细节论证,会更有说服力"——而不是冷冰冰的"×"。
在不需要标准答案的未来,3.0守护的是批判性思维的尊严。
AI智能内容工厂:无限生成的私有化教研助手
2.0时代,我们为每一个客户搭建了私有内容库和校本资源库——这是"存量"的积累。3.0在此基础上增加了"增量"的智能生产:我们提供全套AI化内容创作工具,阅读材料、测评题目、解析注释、跨学科融合内容,均可基于格灵48级分级标准快速或批量生成。
这绝非泛泛的AIGC。生成的每一篇文章、每一道题,都严格锚定特定年级的成长要求与教学大纲,难度系数精确可控,内容价值经过知识体系校验。它是您私域里的"最佳初稿搭子"——教师提出需求,AI即时交付,你还可以编辑微调润色,让效率提升90%。
双轮驱动:为什么2.0与3.0必须并存?
3.0是创新模式,2.0是成熟的标准化模式。我们并未用3.0取代2.0,而是让两者形成"双轮驱动"。为何?因为教育的场景本就多元:
- 当面临模考、区域统考时,需要2.0的标准化测评——稳定、可比、符合考试规范;
- 当进行日常阅读训练、素养提升时,需要3.0的非标准交互——灵活、个性、鼓励思考。
3.0的系统底座让2.0在保持原有业务规则不变的情况下,能力大幅增强(如更精准的题目推荐、更智能的错题分析);而2.0的严谨性又为3.0的创造性划定了安全边界。这是我们对教育科技的理解:创新不应是颠覆,而是有传承的进化。
写在最后
以上仅仅是3.0系统的一部分内容,更多的内容你可以访问格灵阅读的官网glreading.com,并关注公众号,同时也可以与我们取得联系。
目前的更新速度相信每一次微小的迭代,都会加速质的飞跃。今年2月1日,阅读教育正式立法。过去的短短10余天,我们接到了10多个省市级合作伙伴的邀请。当算力成为唯一的制约,当7×24小时的AI生产力已经就绪,教育的未来正在我们眼前展开。
未来已来,阅读无界。
期待与您同行,共同探索阅读与AI的无限可能。
此致敬礼
格灵阅读
2026年春节前夜