核心内容摘要
智能 SaaS 中 FinOps:成本管理革新与盈利策略探索
Semantic Kernel语义内核是由微软开发的开源 AI 开发工具包SDK旨在帮助开发者将大语言模型LLM能力无缝集成到 C#、Python 和 Java 应用中快速构建企业级 AI 智能体Agent、RAG检索增强生成系统等高级应用。
核心定位Semantic Kernel 不是一个 LLM而是一个“AI 中间件”—— 它抽象了与大模型交互的复杂性提供统一接口让开发者专注于业务逻辑而非底层调用细节。
✅ 目标让传统代码 大模型 智能应用
五大核心概念
Kernel内核是整个系统的“容器”或“中枢”。
负责管理AI 服务如 OpenAI、Azure OpenAI、Ollama、Google AI 等插件Plugins提示词模板Prompt Templates向量存储Vector Stores支持依赖注入、中间件如日志、安全过滤器。
Plugins插件插件是扩展 LLM 能力的关键分为两类类型实现方式特点适用场景语义插件Semantic Plugin基于skprompt.txtconfig.json的提示词模板无需写代码靠 Prompt 控制输出文本生成、翻译、摘要等创意任务本地插件Native Plugin用 C#/Python/Java 编写的类和方法可执行确定性逻辑如调 API、查数据库获取实时数据、执行业务操作示例[KernelFunction, Description(获取当前时间)] public string GetCurrentTime() DateTime.Now.ToString(yyyy-MM-dd);
Prompt Engineering提示工程支持变量插值如支持角色设定system/user/assistant可通过模板文件管理便于版本控制和团队协作。
AI ServicesAI 服务集成支持多后端OpenAI / Azure OpenAIGoogle GeminiAmazon BedrockOllama本地模型如 Llama
QwenHugging Face需自定义 HTTP Client 即使官方未直接支持某模型如 ChatGLM也可通过自定义 HttpClient接入。
Vector Stores向量存储用于 RAG 场景支持Azure AI SearchQdrantRedisWeaviatePinecone社区支持⚙️
典型工作流程函数调用当用户提问 “杭州今天天气如何”Kernel 将所有可用插件函数序列化为 JSON Schema将聊天历史 函数描述发送给 LLMLLM 决定是否调用函数如GetCityId(杭州)→GetWeather(cityId)Kernel 自动解析函数调用请求执行本地代码将结果回填到对话上下文再次送入 LLM 生成最终回答循环直到 LLM 返回纯文本响应。
✅ 全过程自动完成无需手动解析 function_call。