700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 大模型训练-实战:模型 算力 数据训练实际情况【LLaMA系列(zhixi-13b) mt5系列(

大模型训练-实战:模型 算力 数据训练实际情况【LLaMA系列(zhixi-13b) mt5系列(

时间:2019-02-16 15:07:18

相关推荐

大模型训练-实战:模型 算力 数据训练实际情况【LLaMA系列(zhixi-13b) mt5系列(

一、LLaMA系列

1、zhixi-13b-sft(包含官方lora模块)

(base) root@container-be6711b100-146dc186:~/tmp/zhixi-13b-sft# ls -l --block-size=mtotal 49653M-rwxr-xr-x 1 root root 1M Jul 1 12:07 config.json-rwxr-xr-x 1 root root 1M Jul 1 12:07 generation_config.json-rwxr-xr-x 1 root root 9496M Jul 1 12:15 pytorch_model-00001-of-00006.bin-rwxr-xr-x 1 root root 9481M Jul 1 12:22 pytorch_model-00002-of-00006.bin-rwxr-xr-x 1 root root 9481M Jul 1 12:29 pytorch_model-00003-of-00006.bin-rwxr-xr-x 1 root root 9411M Jul 1 12:36 pytorch_model-00004-of-00006.bin-rwxr-xr-x 1 root root 9411M Jul 1 12:43 pytorch_model-00005-of-00006.bin-rwxr-xr-x 1 root root 2376M Jul 1 12:45 pytorch_model-00006-of-00006.bin-rwxr-xr-x 1 root root 1M Jul 1 12:45 pytorch_model.bin.index.json-rwxr-xr-x 1 root root 1M Jul 1 12:45 special_tokens_map.json-rwxr-xr-x 1 root root 1M Jul 1 12:45 tokenizer_config.json-rwxr-xr-x 1 root root

大模型训练-实战:模型 算力 数据训练实际情况【LLaMA系列(zhixi-13b) mt5系列(mt5-xxl-13b)】

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。