文章列表

13 篇公开文章

我终于搞懂了Function Calling和MCP的区别

本文介绍了Function Calling与MCP两种技术。Function Calling是大模型调用预设函数与外部系统交互的能力,用于扩展模型能力、结构化输出和动态决策,适合简单原子化任务。MCP是Anthropic推出的开放通用协议,采用客户端-服务器架构,提供Resources、Tools、Prompts三大能力,支持跨模型跨平台复杂场景。通过门票助手、高德地图MCP、Tavily搜索MCP等案例展示应用。对比显示,Function Calling适合简单低延迟任务,MCP适合复杂多工具联动场景,两者可组合使用。

Function CallingMCPLLMAgent工具调用

二、Agent

本文介绍了两种AI Agent类型:Workflow Agent和ReAct Agent。Workflow Agent通过人工定义规则和工具赋能,解决LLM的幻觉、无执行能力等缺陷,适用于高准确性场景,采用RAG技术、预设工作流和工具调用实现可控性。ReAct Agent则通过“推理→行动→反馈”循环动态完成任务,适用于非固定步骤的任务,如文件查找和故障排查,核心是思维链技术支撑推理过程。文章还通过案例展示了ReAct Agent如何通过多轮工具调用完成复杂任务,并讨论了相关技术架构和产品。

AI大模型应用开发AgentWorkflow AgentReAct AgentLLMRAG

十、AI 赋能的智能测试与质量保障

本文介绍了AI时代软件开发从SDD(规格驱动开发)到TDD(测试驱动开发)的范式转变,强调规格作为可执行表达和测试作为质量保障核心。通过正整数判断和AI投研工具实战案例,展示了TDD的红-绿-重构循环。核心概念“Harness Engineering(驭缰工程)”提出Agent = Model + Harness,强调通过告知、约束、验证三支柱构建可靠系统,包括AGENTS.md导航、Lint规则机械化执行、仓库即记录系统等实践。文章指出,约束越严AI越可靠,需通过自动化规则防止Agent复制坏模式,并介绍了Guides x Sensors矩阵区分计算性与推理性任务。

AI大模型应用开发AISDDTDDHarness EngineeringAgent

五、AI编程(二)

本文介绍了AI编程与机器学习核心知识,涵盖数据可视化、机器学习七步法、经典模型及寿险续保预测案例。首先以香港疫情数据可视化为例,展示趋势、分布等核心维度及七日平均新增计算逻辑。其次讲解机器学习基础,包括七步法(收集数据至评估)、线性模型公式、分类与回归问题区分,以及过拟合/欠拟合判断。接着列举十大经典模型,强调逻辑回归(63.5%)和随机森林的业界高占比。决策树基于信息增益选择特征,随机森林通过bagging集成多棵树提升准确率。最后以寿险客户续保预测为实战案例,应用逻辑回归等模型进行预测与评估。

AI大模型应用开发AI编程机器学习数据可视化决策树随机森林

五、AI编程

本文介绍了AI编程工具,重点讲解Cursor编辑器的核心功能与配置。Cursor Rules分为全局规则(适用于所有项目)和项目规则(仅当前项目生效,优先级更高),用于定制AI编码行为。Cursor提供四种工作模式:Agent(自主多文件编辑)、Plan(先规划后执行)、Debug(自动分析报错)和Ask(纯咨询)。文章还涵盖主流AI编程工具分类(如Cursor、Claude Code、Trae等),以及通过实战案例(Excel报表处理、疫情监控)掌握AI编程流程。

AI大模型应用开发CursorAI编程Cursor Rules编辑器代码生成

四、AI大模型原理及API的使用

本文介绍了AI大模型原理及API使用,涵盖AI分类(分析式与生成式)、大语言模型(LLM)核心能力、ChatGPT训练流程(基于RLHF的SFT、RM、PPO三步)、Token定义、Temperature与Top P参数控制生成多样性,以及AI聊天产品的超能力(联网搜索、读取文件、记忆)。学习目标包括掌握LLM基础、API调用方法及完成四大实战案例。

AI大模型应用开发AI大语言模型LLMAPIToken

一、 从提示工程到 RAG

本文介绍了从提示工程到RAG的核心内容。提示工程是应用层核心技术,通过设计Prompt(包括身份设定、背景、参考资料、样例、指令和限制条件)与大语言模型交互,分为Zero-Shot、One-Shot和Few-Shot三种范式。RAG(检索增强生成)通过构建可检索知识库,解决Prompt字数限制和性能下降问题,执行流程包括知识库构建和检索生成。高级技巧强调“双向奔赴”:优化用户Query(如改写上下文依赖、对比型问题)和适配知识库处理(基于场景和技术理解,构建多维度专属知识库),协同提升检索精度和答案质量。

AI大模型应用开发Prompt EngineeringRAGLLMIn-Context LearningQuery Rewriting

七、Coze 工作原理与应用实例

Coze是字节跳动推出的低代码/零代码AI Agent开发平台,核心由智能体、工作流、插件系统和记忆系统组成。它支持快速搭建基于大模型的Bot,集成60多款内置插件,具备知识库和持久化记忆能力。Coze 2.0新增了云端Vibe Coding开发环境(Coze编程),用户可通过自然语言构建应用并一键部署。平台还提供低代码开发模式,与Dify、n8n相比技术门槛低、字节生态集成强。文章通过搭建五子棋网页和AI新闻助手等实战案例,展示了Coze从创建智能体到配置插件、调试部署的完整流程。

AI大模型应用开发Coze低代码AI Agent工作流插件

八、dify部署与应用

本文介绍了Dify开源LLM应用开发平台的部署与应用。核心内容包括:Dify平台定义及五种应用类型(聊天助手、文本生成、Agent、对话流、工作流);Docker Compose本地化部署步骤(克隆代码、配置环境变量、启动服务、初始化);Chatflow与Workflow的核心区别(对话式交互vs批处理);以及四个实战案例之一——LLM联网搜索工作流的搭建方法(开始→LLM提取关键词→Tavily搜索→LLM总结→结束)。

AI大模型应用开发DifyLLMAgentWorkflowChatflow

三、多模态

本文围绕多模态AI展开,分为三大模块:视觉与语言打通、视觉识别与视觉推理、视觉生成。首先,多模态模型实现跨模态理解与生成,核心价值包括视觉转译、融合推理和视觉编辑。其次,对比传统视觉模型(如Yolo、UNet)与多模态模型(如Gemini、GPT):传统模型精度高、成本低,但需单独训练;多模态模型开箱即用、具备推理能力,但成本高、纯视觉精度中等。最后,聚焦视觉生成,针对电商场景提出解决方案:通过工具、流程和人机协作,解决海报和视频生成痛点。电商视频生成采用视频片段组合方法,结合底层模型库、数据支撑层和业务场景层,实现全流程自动化,降低成本并提升效率。

AI大模型应用开发多模态视觉识别视觉生成电商AI

六、openclaw-搭建你的私人助理

本文介绍了开源项目OpenClaw的安装配置与使用,旨在帮助用户搭建私人助理。内容涵盖前置组件(Node.js、Git、PowerShell等)的安装验证、源码安装步骤(克隆、构建、全局链接)、初始化配置(包括安全设置、网关参数、模型选择),以及飞书集成配置。重点包括Skill技能的配置与调用,以PPT制作为案例,并涉及量化相关技能(如akshare-kline、talib、backtrader)的自定义实现。文章还提及大厂衍生产品及生态应用,并强调工作空间核心文件与加载逻辑。

AI大模型应用开发OpenClaw安装配置Skill技能飞书集成量化