从头训练一个数学编程大模型 - 码农知识堂 - 文章详情页

从头训练一个数学编程大模型

 一、前言

前段时间基于OLMO 框架利用8张卡从头训练一个1B 大模型，以本文做一个简单的工作总结。SFT 微调采用LLaMA-Factory，评测使用OpenCompass 。大模型面向的任务：能写代码，能做简单的数学题。

二、训练

 预训练

预训练语料的数据配比主要参考现有大模型预训练数据来源及分布，数据主要来源于Dolma 数据集。其中，Dolma 数据集中中文语料比较欠缺，因而补充WuDao 中文数据集。大模型预训练语料来源以及配比情况如下：

数据集类型 token数量(B) 采样比例

CC 通用网页 19 2%

C4 通用网页 19 14%

wiki
相关阅读:
谷歌前员工：一流开发工具经验在手却不能用？
Windows高效开发环境配置（一）
常用设计模式总结 + 实例
 建立时间和保持时间
 求第n项的因子数量
 设计模式——装饰器模式（Decorator Pattern）+ Spring相关源码
 windows和linux可以共用的端口连通性是否丢包测试工具paping
美国一声令下，NVIDIA损失超350亿，国产芯片迅速顶上
 RNN在图像压缩领域的应用-Variable rate image compression with recurrent neural networks
入门力扣自学笔记103 C++ （题目编号919）
原文地址：https://blog.csdn.net/lifehack/article/details/140463112