AI术语解读
发表于:2026-03-10 | 分类: AI

Prompt

  • 定义:你与 AI 沟通的直接指令,是引导模型生成响应的输入文本。
  • 大白话:就像你对 AI 说 “这次怎么做”,比如 “帮我写一份产品周报” 或 “总结这篇论文的核心观点”。
  • 作用:定义单次任务的目标和规则,是所有 AI 交互的起点。

    Agent

  • 定义:具备自主决策、任务拆解和协同执行能力的 AI 系统。

  • 大白话:它是 AI 的 “项目经理”。你只需给出一个目标(如 “帮我规划一次周末旅行”),它会自动思考:需要查天气、订机票、找酒店,然后调用对应的技能和工具,全程无需人工干预。

Skills

  • 定义:封装好的、可复用的专业能力包,包含执行逻辑、模板和 SOP。
  • 大白话:它是 Agent 的 “技能手册”。比如 “写爆款小红书笔记” 这个 Skill,里面已经预设了标题公式、内容结构和发布时间建议,AI 遇到类似任务就能直接套用。
  • 价值:把重复的 Prompt 固化成标准化流程,提升效率和一致性。

MCP

  • 定义:AI 连接外部世界的标准化接口,让模型能安全地访问数据库、文件系统、API 等外部资源。
  • 大白话:它是 AI 的 “门禁卡” 和 “USB 接口”。没有它,AI 就像被关在房间里,无法查询公司 CRM、读取本地文件或调用实时数据;有了它,就能像插拔 U 盘一样,安全、统一地连接各种工具和服务。
  • 核心价值:即插即用、数据安全、降低集成成本。

Vibe Coding

Vibe Coding(氛围编程) 是一种 AI 辅助的软件开发实践:开发者用自然语言向大语言模型(LLM)描述需求,由 AI 生成代码,开发者通过运行结果而非阅读代码来判断是否正确。
和传统 AI 辅助编程的关键区别在于——开发者主动放弃对代码的逐行理解

“如果 LLM 写了你所有的代码,但你逐行审查、测试、理解了它,那不叫 Vibe Coding——那叫用 LLM 当打字助手。”

参考链接: https://zhuanlan.zhihu.com/p/2010879714030540578

常用工具汇总:

工具类别 工具名称 核心定位 关键能力 适用场景
IDE 集成工具 Cursor AI 原生代码编辑器(VS Code 定制) 自然语言对话、Composer/Agent、多文件编辑、内置 Claude/DeepSeek 日常开发、复杂重构、全栈项目
GitHub Copilot IDE 代码补全与生成 实时代码补全、上下文感知、多语言支持 快速编码、减少重复代码
Windsurf VS Code 增强版 AI 编程 Cascade 深度上下文、多文件编辑、项目结构理解、预览 大型项目、深度重构
JetBrains Junie JetBrains IDE 内置 AI 助手 代码生成、重构、文档、调试、全 IDE 集成 IntelliJ/PyCharm 等生态开发
Cline(原 ClaudeDev) VS Code 自主 Agent 执行终端命令、文件操作、跨文件修改、任务自动化 项目维护、批量修改、自动化任务
云端 / 网页工具 Replit 云端 IDE+AI Agent 浏览器运行、多语言、AI 生成 + 运行、一键部署 快速原型、算法验证、教学
Coze(扣子) 国内云端 AI 开发平台 中文交互、代码生成 + 运行、打包机器人 / 小程序 国内小工具、微信生态、低代码
v0(Vercel) UI 原型生成 手绘 / 描述生成前端页面、风格定制、可导出代码 前端原型、UI 快速落地
Bolt.new 全栈应用生成 自然语言生成完整前后端、预览、部署 MVP 快速验证、全栈小应用
终端 / CLI 工具 Aider 终端 AI 结对编程 操作 Git 仓库、自动修改文件、跑测试、提交 命令行工作流、Git 项目、批量修改
Claude Code 终端版编码助手 理解代码库、文件编辑、测试、Git、语音模式 终端重度用户、远程协作、语音编程
独立应用 / 平台 Retool 企业级内部工具平台 连接数据源、可视化搭建、AI 辅助、安全部署 企业内部系统、数据看板、管理后台
Lovable 低代码 + AI 应用生成 拖拽 + 自然语言、快速构建 Web 应用

CLI

CLI = Command-Line Interface,命令行界面

简单说:
不用鼠标点图形窗口,只用键盘敲文字命令来操作电脑 / 软件

目前AI模型排名

2026/3/11
基于2026年3月最新行业评测与实战数据,为你整理了主流AI模型的综合实力排名与核心应用场景对照表。数据综合参考了LMSYS Chatbot Arena ELO评分、MMLU/HumanEval基准测试及OpenClaw智能体任务表现,兼顾技术能力与落地价值。

🏆 2026主流AI模型综合实力与应用场景总表

综合排名 模型名称 代表版本/厂商 核心定位 关键能力亮点 核心应用场景 综合评分(ELO/基准)
1 Claude 4 Opus Anthropic 企业级Agent与长文专家 1M上下文、SWE-bench 80.9%、指令遵循度高 长篇文档分析、企业知识库、代码审查/重构、法律合规 1265 (LMSYS)
2 Gemini 3.1 Pro Google 原生多模态与超大规模吞吐 1M+上下文、Agentic Vision、视频理解强 大规模视频处理、多模态智能体、完整GitHub仓库分析、长文档合规审查 1287 (LMSYS)
3 GPT-5.2 Omni OpenAI 全球通用能力标杆 全模态融合、复杂推理、生态最完善 复杂逻辑任务、科研论证、实时语音交互、企业级全栈方案 1215 (LMSYS)
4 Kimi K2.5 月之暗面 长文本与学术科研利器 1.04T参数MoE、无损压缩、DeepSearch 文献综述/百页PDF解析、学术论文写作、长文数据挖掘、科研协作 1220 (LMSYS)
5 DeepSeek-R1 深度求索 理工与代码性价比首选 数学推理强、SWE-bench 80.2%、成本友好 科研数据处理、算法开发、嵌入式代码生成、技术文档撰写 1398 (综合基准)
6 Qwen 3.5 Max 阿里巴巴 国产综合能力最强 201种语言、128k上下文、多模态协同 跨境电商、多语言内容、企业级国产化部署、中文专业场景 综合第一梯队
7 GLM-5 智谱AI 低幻觉与国产部署友好 440B参数、低幻觉率、全模态 政务办公、金融风控、医疗辅助、国产化企业服务 综合第一梯队
8 豆包2.0/Seed 2.0 字节跳动 中文体验与移动端多模态 中文语境适配、视频理解、娱乐化交互 短视频创作、移动端助手、日常办公、情感陪伴 国产头部
9 Llama 4-405B Meta 开源生态与轻量化部署 开源友好、405B参数、社区活跃 二次开发、垂直场景定制、本地部署、中小企业AI底座 1321 (综合基准)
10 文心一言5.0 百度 知识搜索与企业服务 实时搜索联动、知识图谱、行业方案 智能客服、知识问答、行业报告、政务与医疗 综合第一梯队

📊 梯队划分与核心差异

  • T0 全球标杆:Claude 4 Opus、Gemini 3.1 Pro、GPT-5.2 Omni
    技术与商业化全满贯,生态成熟度最高,适合企业级核心业务与复杂任务。
  • T0.5 国产先锋:Kimi K2.5、DeepSeek-R1、Qwen 3.5、GLM-5
    中文适配与垂直场景能力突出,性价比高,适合国内企业与科研场景。
  • T1 开源与区域龙头:Llama 4-405B、豆包2.0、文心一言5.0
    开源友好或区域生态完善,适合二次开发与本地化部署。

🎯 场景化选型建议

  1. 科研与学术:优先 Kimi K2.5(长文本处理)、DeepSeek-R1(理工推理)、GPT-5.2(复杂论证)。
  2. 企业办公与知识库:优先 Claude 4(长文档)、Gemini 3(多模态)、GLM-5(低幻觉)。
  3. 中文内容创作:优先 豆包2.0(娱乐化多模态)、Qwen 3.5(多语言协同)。
  4. 代码与开发:优先 Claude 4(SWE-bench领先)、DeepSeek-R1(性价比)、GPT-5.2(全栈生态)。
  5. 国产化部署:优先 GLM-5Qwen 3.5(国产芯片适配完善)。

💡 关键趋势提示

  • 2026年大模型正从“能力比拼”转向“场景落地”,上下文窗口(1M+)与多模态原生融合成为核心竞争力。
  • 国产模型在中文理解长文本处理性价比方面已全面领先海外,成为国内企业首选。
  • AI Agent工具调用成为主流,模型正深度嵌入办公、开发、服务等全流程。
上一篇:
Obsidian Cli与Claude Code配置
下一篇:
Claude Code安装及配置