❶ Semantic Kernel 视角下的 Text2SQL 实践与思考
《诗经》有言:七月流火,九月授衣,描绘夏秋交替、天气由热转凉的季节变化。西安的雨季,自六月下旬悄然而至、连绵不绝,古人诚不欺我。前有萝卜快跑及其无人驾驶引发热议,后有特朗普竞选集会遇刺,洞庭湖决口、西二环塌方,成长便是学会心平气和地面对这世界的兵荒马乱。历史似乎被诅咒了时间?两年前,安倍晋三遇刺,我写《杂感·七月寄望》。回想起两人长达19秒的握手画面,有种“一笑泯恩仇”的错觉,似乎成为了共患难的“战友”。雍正之于万历,特朗普之于肯尼迪,时过境迁,似曾相识,世间万物总逃不出某种循环。最近,从 RAG 到 Agent,再到微软 GraphRAG 的爆火,激活了 Graph、NER、知识图谱等知识点。我需要一篇文章整理思绪。
实现 Agent 后,参照复旦大学的 RAG 综述论文,目标转向 Agent。一个 Agent 至少具备规划、记忆、工具使用能力。Agent 从说话进化到做事,标志着大模型的进步。市场上主流新能源汽车的智驾系统大多处于 L2 或 L3 级别,萝卜快跑则迈进 L4 级别。科技创新可能导致成千上万的人失业,是否过于残酷和冰冷?接触多种 Agent 产品,如 FastGPT、Coze、Dify,它们基于工作流编排,是大型模型输出不稳定和多轮对话调用成本的妥协。我坚信动态规划和执行任务的能力才是未来。参考 Semantic Kernel 实现了支持 ReAct 模式的 Planner。
主张小模型结合插件推进 AI 服务本地化,平衡技术和成本,避免永无休止的百模大战。GraphRAG 知识图谱结合大模型虽好,构建成本相对较高,费用在5到10美元。使用阿里的 Qwen2-7B 模型支持任务规划、参数提取,Ollama 推理速度较慢。Agent 反思功能依赖多轮对话,效果受上下文长度影响。使用 OpenAI、Moonshot 等服务,TPM/RPM 通常不高,难以满足 Agent 运行需求。Agent 的 token 消耗量在任务导向下是一笔不小的开销。
调试过程中,我将 OpenAI 和 Moonshot 用至“欠费”,转向更为经济的 DeepSeek。有人抱怨生成答案时间变长,这在 Agent 中同样存在。大模型观察当前结果,尝试使用不同工具解决问题,但往往耗费时间和金钱,未能得到满意答案。关键推理能力来自模型本身,提示词只是锦上添花。面对完全未知事物,这一切有何意义?以电商业务为例,数据链路长、涉及多个微服务,难以满足强一致性和低延迟。这一道理同样适用于 Agent,动态规划和人工编排的工作流,接受可能耗费大量时间的现实。对于 RAG 这样的检索型任务,需要平衡检索精度和响应时间。
接入日期/时间、天气预报、新闻报道、搜索引擎、网络爬虫等工具后,感觉一切索然无味,大模型不再像原来那样“开朗”,甚至变得不苟言笑起来。它变成了合格的“工具人”,但是否应该这样修饰?一切的元兇在于外部知识“污染”了它的先验知识,它并不比市面上的 AI 助手强大多少。
Text2SQL 实践将大型模型与关系型数据库连接,实现 Agent 后发现 RAG 是一个工具,广义的 RAG 并非局限于向量数据库,可以扩展到搜索引擎、知识图谱、第三方 API、数据源等。大模型可以从数据库读取信息,掌握广泛数据源。SQL 和 Python、C# 等编程语言类似,属于代码生成范畴,SQL 更简单。Text2SQL 技术让大模型生成 SQL 语句,从大模型到数据库的链路打通。实现步骤包括获取数据库 Schema,了解表和字段,通过代码生成 Schema 信息,将 Schema 作为参数传入提示词模板。实现后,用户给出查询,大模型生成 SQL 语句执行,返回结果,最后生成最终答案。面对复杂查询,大模型力不从心,出现各类问题。总的来说,Text2SQL 虽有不足,但让大模型连接关系型数据库成为可能。技术不应成为普通人使用和学习的门槛,应该让万物与大模型连接,成为不可或缺的基础设置。
对效率的反思,追求效率最大化,技术编织的“效率提升”陷阱。聊天软件方便沟通,但难以理解对方想法,信息处理效率提升,但世界变得不那么真实。算法将人们关进信息茧房,外卖员时间压缩,开发周期缩短。新的技术带来机遇,但真正追求的效率应该让人感到幸福。无人驾驶、生成式 AI 虽然正确,但不一定带来幸福感。实现 Agent 后,发现价值有限,AI 满足情绪需求,人类依然需要主动推导答案。文章小结:文章内容与标题联系松散,难以整理清晰知识体系。面对大量碎片化信息,难以在短时间内整理,技术进步带来便利,也带来了内卷和不幸福感。文章试图表达的远不止 Text2SQL,但只能找到这个话题。在职场中,为员工设置障碍以确保工作量,是职场中的潜规则。技术没有立场,真正推动效率的始终是人。文章反思效率提升对人类的负面影响,寻求更人性化、幸福感更高的效率模式。