一.iNeuOS_LLM

训练自主的领域大模型基于DeepSeek-R1-Distill-Qwen-1.5B模型训练自主的领域大模型，例如打造针对钢铁、矿山、有色、稀土、建材、加工制造等领域的大模型。促进大模型技术在具体领域的应用与落地，助力行业向智能制造转型升级。

二.微调模型训练过程及代码

1.代码工程目录

├───📂 deepseek-ai/
│ ├───📂 DeepSeek-R1-Distill-Qwen-1.5B/ //基础模型
├───📂 docx_input/ //生成数据集的基础Word文件
├───datasets.json/ //微调训练模型的输入数据集文件
├───merged_model.py/ //用于合并基础模型与微调后的模型
├───test_base_model.py/ //测试基础模型
├───test_merged_model.py/ //测试合并后的模型
├───test_train_model.py/ //测试微调后的模型
├───train_model.py/ //微调训练模型
├───training_dataset.json/ //转换Word生成的数据集文件
├───word_to_dataset.py/ //用于转换Word生成的数据集

2.下载基础模型DeepSeek-R1-Distill-Qwen-1.5B

使用huggingface-cli下载基础模型,工具下载地址：https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

3.准备数据集

（1）把准备好的Word文件，放入docx_input文件夹。
（2）运行word_to_dataset.py代码，会生成training_dataset.json数据集文件，把training_dataset.json文件名称改为datasets.json。数据集有很大的调优空间。

4.训练模型

（1）运行train_model.py，训练模型，以我的笔记本配置，训练完成datasets.json数据集需要将近4个小时。
（2）训练完成的模型保存在deepseek-1.5b-lora-final目录下。
（3）使用test_train_model.py代码测试基础模型与训练后的模型。

5.合并模型

（1）运行merged_model.py代码，把基础模型与训练后的模型合并成一个整体的模型，保存在deepseek-1.5b-lora-merged目录下。
（2）运行test_merged_model.py代码，测试合并后的模型。应用效果参见本文章节：测试微调训练后的大模型。

三.电脑配置

四.iNeuOS工业互联网公众号：

五.官方网站:http://www.ineuos.net

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

一.iNeuOS_LLM

二.微调模型训练过程及代码

1.代码工程目录

2.下载基础模型DeepSeek-R1-Distill-Qwen-1.5B

3.准备数据集

4.训练模型

5.合并模型

三.电脑配置

四.iNeuOS工业互联网公众号：

五.官方网站:http://www.ineuos.net

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
.gitattributes		.gitattributes
README.md		README.md
datasets.json		datasets.json
merged_model.py		merged_model.py
test_base_model.py		test_base_model.py
test_merged_model.py		test_merged_model.py
test_train_model.py		test_train_model.py
train_model.py		train_model.py
word_to_dataset.py		word_to_dataset.py

wxzz/iNeuOS_LLM

Folders and files

Latest commit

History

Repository files navigation

一.iNeuOS_LLM

二.微调模型训练过程及代码

1.代码工程目录

2.下载基础模型DeepSeek-R1-Distill-Qwen-1.5B

3.准备数据集

4.训练模型

5.合并模型

三.电脑配置

四.iNeuOS工业互联网公众号：

五.官方网站:http://www.ineuos.net

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages