广州市网站建站,网络营销的重点,记事本做网站格式,万能视频下载工具数据集#xff1a;中文基于满血DeepSeek-R1蒸馏数据集#xff08;Chinese-Data-Distill-From-R1#xff09; 中文数据集中的数据分布如下#xff1a; Math#xff1a;共计36568个样本#xff0c; Exam#xff1a;共计2432个样本#xff0c; STEM#xff1a;共计12648个…数据集中文基于满血DeepSeek-R1蒸馏数据集Chinese-Data-Distill-From-R1 中文数据集中的数据分布如下 Math共计36568个样本 Exam共计2432个样本 STEM共计12648个样本 General共计58352包含弱智吧、逻辑推理、小红书、知乎、Chat等。 数据样例 基于unsloth进行微调 微调过程及显存占用 微调后推理测试 推理显存占用
在通用数据集上微调很成功但是在专业数据集上微调却不行我使用控制变量进行了许多次测试都无法得到好的效果无论是回答格式还是回答内容都无法使用。至少在华为910上是这样