基于SFT后的billa权重续训问题 #39

Jiangchenglin521 · 2023-07-04T09:42:22Z

1，（题外）现在llama感觉已经放松了，vicuna都已经全量放在hf上来，咱们hf模型能不能不搞这种权重mask操作，直接上一个可用版本呢？这样第一步的convert就不用自己搞了。
2，看训练里只是说到了要想基于sft的续训，就要还原成原始的billa-llama的模型文件进行训练。但没有给出脚本，这边想问下，大佬能不能直接将sft后的可以续训的模型文件发我一下呢？或者有没有反向转换教程提供下~。这边想基于第三阶段模型微调一下。

YuxuanLei2000 · 2024-09-04T01:08:20Z

同问，想继续微调模型

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

基于SFT后的billa权重续训问题 #39

基于SFT后的billa权重续训问题 #39

Jiangchenglin521 commented Jul 4, 2023

YuxuanLei2000 commented Sep 4, 2024

基于SFT后的billa权重续训问题 #39

基于SFT后的billa权重续训问题 #39

Comments

Jiangchenglin521 commented Jul 4, 2023

YuxuanLei2000 commented Sep 4, 2024