MCP Server简单实现与一些发现的问题 Posted on April 1, 2025 本文是笔者学习MCP过程中记录的一些流水账,主要记录了MCP服务器的简单实现案例,以及在此过程中发现的MCP所存在的一些可以继续完善的内容。 [Read More]
学习LLM微调 @2 - 在Macbook Air上使用mlx进行微调 Posted on February 26, 2025 在上一篇文章中笔者初步尝试了通过线上的微调服务来 对大模型进行微调。但很显然,线上服务难以用在生产环境中。因为一方面,涉及到企业信息安全问题,不能直接将数据送到线上; 另一方面,在线上微调的模型只能作为API调用而不能下载微调的权重。 [Read More]
学习LLM微调 @1 - 在线完成极简微调 Posted on February 22, 2025 这是笔者学习大模型微调的第一篇笔记。本着从易到难,循序渐进的原则,第一步先尝试通过现有的数据集和微调服务平台完成一个小demo,初步了解整个微调的流程。 [Read More]
让30+大模型做考公题目,能上岸否? Posted on February 4, 2025 笔者让目前市面上主流的大模型来做公务员考试行测真题,来尝试从一个侧面观察大模型的综合能力。在让30多个大模型各做了一千多道行测题后,笔者发现了一些比较有意思的线索(非专业大模型研究者,观点仅供参考): [Read More]