一日建成罗马城:从0到1的LLM快速应用
前言
本博客仅为了快速入门,所以很多专业知识一笔带过甚至有失偏颇,还望读者自行查证
所以前面标有 * 号的内容为可以在初次了解,准备快速应用时可以直接跳过
0x00 技术准备
node.js
ai领域作为包管理器,使用ai则必装
安装:在这里下载msi安装包并安装,然后设置镜像:
1 | |
cmd
很基础,但我感觉有人不会。
按一下win键直接搜cmd就能打开了
以下所有命令都在cmd/powershell 或它的子窗口运行
技巧:在项目文件下,在文件路径的框里面输入cmd会自动打开本目录的cmd
加速器
额,你至少需要一个可以加速github的加速器,或者配一下host。
0x01 一些概念
LLM
LLM是什么?
简单理解就是,它是一个神秘的盒子,你塞个纸条给它,它就给你回一个。
注意,我说的是一个。
LLM实质上是只支持单次问答的,它本身不带记忆。而诸如对话历史、工具调用等等功能,都是在给它的纸条里塞了规则。
比如“我们上次聊到XXX了”,“以下是你可以调用的工具列表”等等。
理解这些并不难,但是理解后可能会对你要做的项目有所帮助。
中转站
世界上的模型供应商其实就那么几家(更别说尖端模型了),比如deepseek、claude、gemini、gpt。
实质上,供应商就是给你提供了一个窗口,也就是api,让你可以和llm愉快的传纸条。
但是以上提到的供应商除了deepseek按量买都非常昂贵且对国内用户非常不友好,于是中转站诞生了。
中转站是中间商,朝个人开发者收取费用提供 api 调用,而费用通常是廉价的,并且不需要魔法。
选择一个好的中间商(除非你量大直接接官方)是很重要的,因为一些奸商会把你的信息拿出去卖、给模型掺水把你的尖端模型请求路由到垃圾模型、或者定一个奇高无比的价格。
我会讲一下怎么选一个中转站,并且在评论区给点推荐,但那是以后,我将先完成这篇博客。
当然直接用deepseek也不失为一个好的选择,毕竟它已经以极低的价格跑出了第一梯队的实力了。
*mcp与tool
这两个概念属于进阶玩法,初次接触LLM应用时可以暂时跳过,但理解它们能让你未来的项目更有想象力。
MCP
可以理解为LLM的“外设接口标准”。就像USB让不同设备都能插进电脑一样,MCP让LLM可以标准化地接入文件系统、数据库、浏览器、代码解释器等外部工具。
举个例子:通过MCP,你可以让LLM直接读取你电脑上的Excel文件并分析数据,而不需要手动复制粘贴内容给它。
Skill
这是将一组提示词、工具调用逻辑、输出格式打包成一个“可复用的能力模块”。比如你可以做一个“论文润色Skill”,输入草稿,LLM会自动按学术规范调整格式、优化措辞、生成参考文献。
Skill本质上是把复杂的多步骤任务封装成一个简单的指令,让LLM像调用函数一样完成特定工作。
它比mcp更加灵活,但是耗费也会更高。
0x02 前置应用
CC-switch
CC-switch可以很快速度的配置模型供应商,强烈建议装上。
去这里翻到最下面下载 .msi 文件直接安装。