❶ Semantic Kernel 視角下的 Text2SQL 實踐與思考
《詩經》有言:七月流火,九月授衣,描繪夏秋交替、天氣由熱轉涼的季節變化。西安的雨季,自六月下旬悄然而至、連綿不絕,古人誠不欺我。前有蘿卜快跑及其無人駕駛引發熱議,後有特朗普競選集會遇刺,洞庭湖決口、西二環塌方,成長便是學會心平氣和地面對這世界的兵荒馬亂。歷史似乎被詛咒了時間?兩年前,安倍晉三遇刺,我寫《雜感·七月寄望》。回想起兩人長達19秒的握手畫面,有種「一笑泯恩仇」的錯覺,似乎成為了共患難的「戰友」。雍正之於萬曆,特朗普之於肯尼迪,時過境遷,似曾相識,世間萬物總逃不出某種循環。最近,從 RAG 到 Agent,再到微軟 GraphRAG 的爆火,激活了 Graph、NER、知識圖譜等知識點。我需要一篇文章整理思緒。
實現 Agent 後,參照復旦大學的 RAG 綜述論文,目標轉向 Agent。一個 Agent 至少具備規劃、記憶、工具使用能力。Agent 從說話進化到做事,標志著大模型的進步。市場上主流新能源汽車的智駕系統大多處於 L2 或 L3 級別,蘿卜快跑則邁進 L4 級別。科技創新可能導致成千上萬的人失業,是否過於殘酷和冰冷?接觸多種 Agent 產品,如 FastGPT、Coze、Dify,它們基於工作流編排,是大型模型輸出不穩定和多輪對話調用成本的妥協。我堅信動態規劃和執行任務的能力才是未來。參考 Semantic Kernel 實現了支持 ReAct 模式的 Planner。
主張小模型結合插件推進 AI 服務本地化,平衡技術和成本,避免永無休止的百模大戰。GraphRAG 知識圖譜結合大模型雖好,構建成本相對較高,費用在5到10美元。使用阿里的 Qwen2-7B 模型支持任務規劃、參數提取,Ollama 推理速度較慢。Agent 反思功能依賴多輪對話,效果受上下文長度影響。使用 OpenAI、Moonshot 等服務,TPM/RPM 通常不高,難以滿足 Agent 運行需求。Agent 的 token 消耗量在任務導向下是一筆不小的開銷。
調試過程中,我將 OpenAI 和 Moonshot 用至「欠費」,轉向更為經濟的 DeepSeek。有人抱怨生成答案時間變長,這在 Agent 中同樣存在。大模型觀察當前結果,嘗試使用不同工具解決問題,但往往耗費時間和金錢,未能得到滿意答案。關鍵推理能力來自模型本身,提示詞只是錦上添花。面對完全未知事物,這一切有何意義?以電商業務為例,數據鏈路長、涉及多個微服務,難以滿足強一致性和低延遲。這一道理同樣適用於 Agent,動態規劃和人工編排的工作流,接受可能耗費大量時間的現實。對於 RAG 這樣的檢索型任務,需要平衡檢索精度和響應時間。
接入日期/時間、天氣預報、新聞報道、搜索引擎、網路爬蟲等工具後,感覺一切索然無味,大模型不再像原來那樣「開朗」,甚至變得不苟言笑起來。它變成了合格的「工具人」,但是否應該這樣修飾?一切的元兇在於外部知識「污染」了它的先驗知識,它並不比市面上的 AI 助手強大多少。
Text2SQL 實踐將大型模型與關系型資料庫連接,實現 Agent 後發現 RAG 是一個工具,廣義的 RAG 並非局限於向量資料庫,可以擴展到搜索引擎、知識圖譜、第三方 API、數據源等。大模型可以從資料庫讀取信息,掌握廣泛數據源。SQL 和 Python、C# 等編程語言類似,屬於代碼生成范疇,SQL 更簡單。Text2SQL 技術讓大模型生成 SQL 語句,從大模型到資料庫的鏈路打通。實現步驟包括獲取資料庫 Schema,了解表和欄位,通過代碼生成 Schema 信息,將 Schema 作為參數傳入提示詞模板。實現後,用戶給出查詢,大模型生成 SQL 語句執行,返回結果,最後生成最終答案。面對復雜查詢,大模型力不從心,出現各類問題。總的來說,Text2SQL 雖有不足,但讓大模型連接關系型資料庫成為可能。技術不應成為普通人使用和學習的門檻,應該讓萬物與大模型連接,成為不可或缺的基礎設置。
對效率的反思,追求效率最大化,技術編織的「效率提升」陷阱。聊天軟體方便溝通,但難以理解對方想法,信息處理效率提升,但世界變得不那麼真實。演算法將人們關進信息繭房,外賣員時間壓縮,開發周期縮短。新的技術帶來機遇,但真正追求的效率應該讓人感到幸福。無人駕駛、生成式 AI 雖然正確,但不一定帶來幸福感。實現 Agent 後,發現價值有限,AI 滿足情緒需求,人類依然需要主動推導答案。文章小結:文章內容與標題聯系鬆散,難以整理清晰知識體系。面對大量碎片化信息,難以在短時間內整理,技術進步帶來便利,也帶來了內卷和不幸福感。文章試圖表達的遠不止 Text2SQL,但只能找到這個話題。在職場中,為員工設置障礙以確保工作量,是職場中的潛規則。技術沒有立場,真正推動效率的始終是人。文章反思效率提升對人類的負面影響,尋求更人性化、幸福感更高的效率模式。