快速设置HuggingFace镜像源:简单易懂教程
创作时间:
作者:
@小白创作中心
快速设置HuggingFace镜像源:简单易懂教程
引用
CSDN
1.
https://blog.csdn.net/yyh2508298730/article/details/137783361
本文将介绍两种设置HuggingFace镜像源的方法:非入侵式和hdf方法。通过这些方法,你可以更快速、稳定地下载HuggingFace平台上的模型和数据集。
镜像设置
进入Python虚拟环境安装依赖:
pip install -U huggingface_hub
方式一:非入侵式
在相应运行脚本开头加入下列代码:
import os
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
然后运行脚本就行,模型就能正常下载,可能有些模型需要HuggingFace的token API,具体看下一步。
设置Token
有些模型需要使用Hugging Face账户的访问令牌才能够下载,如果不需要可以忽略这一步。具体设置方法如下:
- 首先需要去自己的HuggingFace账户中找到这个Token,右上角找到自己的头像,点击个人信息:
点击Setting
复制READ中的Token到huggingface_hub.login()中
如果没装huggingface_hub库,可以通过一下命令安装:
pip install huggingface_hub
在Python脚本开头、刚才设置的环境变量之下输入下面的指令,并且粘贴Token进去:
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
import huggingface_hub
huggingface_hub.login("你的Token")
方式二:hdf方法
hdf的GitHub项目详细地址:链接:Huggingface Model Downloader
该方法的好处在于下载能多线程,下载速度很快。
- 安装hfd.sh
wget https://hf-mirror.com/hfd/hfd.sh
- 给它运行权限
chmod a+x hfd.sh
- 设置环境变量
Linux系统:
export HF_ENDPOINT=https://hf-mirror.com
Windows系统
打开Windows Powershell(管理员)
$env:HF_ENDPOINT = "https://hf-mirror.com"
- 使用 aria2c 和多线程下载 网速超快且不会断连
sudo apt-get install aria2
- cd进入要clone的文件夹
./hfd.sh 模型名称 --tool aria2c -x 4
hfd的具体用法:
hfd <model_id> [--exclude exclude_pattern] [--hf_username username] [--hf_token token] [--tool wget|aria2c] [-x threads] [--dataset]
参数:
- model_id: 用于指定想要下载的模型或数据集的Hugging Face标识符,格式通常为’repo/model_name’。例如bigscience/bloom-560m。
- --exclude (exclude_pattern): 可选参数,用于指定下载时要排除的文件模式。匹配此模式的文件将不会被下载。例如,使用--exclude safetensors会排除所有名字中包含safetensors的文件。
- --hf_username: 可选参数,Hugging Face账户的用户名。如果需要验证才能下载某些模型或数据集,需要提供此参数。
- --hf_token: 可选参数,Hugging Face账户的访问令牌。配合--hf_username使用,用于验证下载。
- --tool: 可选参数,指定下载工具。可以是wget(默认)或aria2c。aria2c支持多线程下载,可能更快。
- -x: 可选参数,仅当使用aria2c时有效。用于指定下载时的线程数。例如-x 8表示使用8个线程下载。
- --dataset: 可选参数,用来标记下载的是数据集而非模型。如果要下载的是数据集,需要添加此参数。
热门推荐
浅谈山西“醋”文化:为何天下陈醋出清徐?其他地方,不能复制
孩子睡觉口呼吸,就是腺样体肥大吗?
什么是安全审计?六大类型及流程详解
狮子为什么要划为猫科动物?狮子是大型猫科动物狮子有多
植物蛋白VS动物蛋白:营养专家详解关键差异
营养的糙米要怎么煮才适合宝宝吃?大部分人吃得不对
搬家吉日时辰怎么算 搬家吉日时辰怎么算出来的
外食族也能补足膳食纤维!营养师传授健康管理三大择食攻略
从神煞的形象,浅谈他的含义与运用
胡志明市咖啡指南:从百年老店到现代精品,探寻越南咖啡文化的独特魅力
马来西亚USM大学传播学专业详解及留学指南
论文等级分类及撰写要点详解
红米K50耳机转接线:有无DAC芯片的优劣分析
篮球规则大全:从球场到比赛规则,全面解析篮球精髓
建议收藏!湖北25年上半年自学考试新生注册与身份确认流程
专柜香奈儿香水试用装打碎该不该赔?专家给出明确答案
别在轻信网络上的“谣言”饮食了!不但浪费时间还多花钱,甚至可能会加重发作性睡病
李子种植技术与管理
一文读懂东契奇浓眉交易:湖人寻接班人独行侠争冠 老詹未来存疑
冬天运动后出汗,应如何处理
肾癌肾切除术后半年可以吃螺蛳粉吗
一天一杯咖啡会不会对身体有伤害
十年数据路,终于见到顶尖的绩效分析模型!
解读奥运会历史:从古代辉煌到现代璀璨,过去与现在的辉煌交织
工厂拖欠货款怎么有效要钱
方舟生存进化狮鹫抓捕攻略:从工具准备到实战技巧详解
健身爱好者适宜饮用哪些茶叶以增强健身效果
如何确定建仓的合理成本?这样的确定方法有哪些依据?
60岁留学生如何在澳洲旅游的最佳攻略
高铁跟飞机哪個比較快?深入比較交通工具的速度與效率