一日建成罗马城:从0到1的LLM快速应用

前言

本博客仅为了快速入门,所以很多专业知识一笔带过甚至有失偏颇,还望读者自行查证
所以前面标有 * 号的内容为可以在初次了解,准备快速应用时可以直接跳过

0x00 技术准备

node.js

ai领域作为包管理器,使用ai则必装
安装:在这里下载msi安装包并安装,然后设置镜像:

1
2
npm config set registry https://registry.npmmirror.com
npm config get registry # 验证镜像是否设置成功

cmd

很基础,但我感觉有人不会。
按一下win键直接搜cmd就能打开了
以下所有命令都在cmd/powershell 或它的子窗口运行
技巧:在项目文件下,在文件路径的框里面输入cmd会自动打开本目录的cmd

加速器

额,你至少需要一个可以加速github的加速器,或者配一下host。

0x01 一些概念

LLM

LLM是什么?
简单理解就是,它是一个神秘的盒子,你塞个纸条给它,它就给你回一个。
注意,我说的是一个

LLM实质上是只支持单次问答的,它本身不带记忆。而诸如对话历史、工具调用等等功能,都是在给它的纸条里塞了规则。
比如“我们上次聊到XXX了”,“以下是你可以调用的工具列表”等等。

理解这些并不难,但是理解后可能会对你要做的项目有所帮助。

中转站

世界上的模型供应商其实就那么几家(更别说尖端模型了),比如deepseek、claude、gemini、gpt。

实质上,供应商就是给你提供了一个窗口,也就是api,让你可以和llm愉快的传纸条。

但是以上提到的供应商除了deepseek按量买都非常昂贵且对国内用户非常不友好,于是中转站诞生了。

中转站是中间商,朝个人开发者收取费用提供 api 调用,而费用通常是廉价的,并且不需要魔法。

选择一个好的中间商(除非你量大直接接官方)是很重要的,因为一些奸商会把你的信息拿出去卖、给模型掺水把你的尖端模型请求路由到垃圾模型、或者定一个奇高无比的价格。

我会讲一下怎么选一个中转站,并且在评论区给点推荐,但那是以后,我将先完成这篇博客。

当然直接用deepseek也不失为一个好的选择,毕竟它已经以极低的价格跑出了第一梯队的实力了。

*mcp与tool

这两个概念属于进阶玩法,初次接触LLM应用时可以暂时跳过,但理解它们能让你未来的项目更有想象力。

MCP

可以理解为LLM的“外设接口标准”。就像USB让不同设备都能插进电脑一样,MCP让LLM可以标准化地接入文件系统、数据库、浏览器、代码解释器等外部工具。
举个例子:通过MCP,你可以让LLM直接读取你电脑上的Excel文件并分析数据,而不需要手动复制粘贴内容给它。

Skill

这是将一组提示词、工具调用逻辑、输出格式打包成一个“可复用的能力模块”。比如你可以做一个“论文润色Skill”,输入草稿,LLM会自动按学术规范调整格式、优化措辞、生成参考文献。
Skill本质上是把复杂的多步骤任务封装成一个简单的指令,让LLM像调用函数一样完成特定工作。
它比mcp更加灵活,但是耗费也会更高。

0x02 前置应用

CC-switch

CC-switch可以很快速度的配置模型供应商,强烈建议装上。

这里翻到最下面下载 .msi 文件直接安装。


一日建成罗马城:从0到1的LLM快速应用
https://www.0xff.ink/posts/568288877/
作者
Frank9527
发布于
2026年5月17日
许可协议