• 学习LLM微调 @2 - 在Macbook Air上使用mlx进行微调

    在上一篇文章中笔者初步尝试了通过线上的微调服务来 对大模型进行微调。但很显然,线上服务难以用在生产环境中。因为一方面,涉及到企业信息安全问题,不能直接将数据送到线上; 另一方面,在线上微调的模型只能作为API调用而不能下载微调的权重。 [Read More]
  • 学习LLM微调 @1 - 在线完成极简微调

    这是笔者学习大模型微调的第一篇笔记。本着从易到难,循序渐进的原则,第一步先尝试通过现有的数据集和微调服务平台完成一个小demo,初步了解整个微调的流程。 [Read More]
  • 让30+大模型做考公题目,能上岸否?

    笔者让目前市面上主流的大模型来做公务员考试行测真题,来尝试从一个侧面观察大模型的综合能力。在让30多个大模型各做了一千多道行测题后,笔者发现了一些比较有意思的线索(非专业大模型研究者,观点仅供参考): [Read More]