快速设置HuggingFace镜像源:简单易懂教程
创作时间:
作者:
@小白创作中心
快速设置HuggingFace镜像源:简单易懂教程
引用
CSDN
1.
https://blog.csdn.net/yyh2508298730/article/details/137783361
本文将介绍两种设置HuggingFace镜像源的方法:非入侵式和hdf方法。通过这些方法,你可以更快速地下载HuggingFace上的模型和数据集。
镜像设置
进入Python虚拟环境安装依赖:
pip install -U huggingface_hub
方式一:非入侵式
在相应运行脚本开头加入下列代码:
import os
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
然后运行脚本就行,模型就能正常下载,可能有些模型需要HuggingFace的token API,具体看下一步。
设置Token
有些模型需要使用Hugging Face账户的访问令牌才能够下载,如果不需要可以忽略这一步。具体设置方法如下:
- 首先需要去自己的HuggingFace账户中找到这个Token,右上角找到自己的头像,点击个人信息:
点击Setting
复制READ中的Token到huggingface_hub.login()中
如果没装huggingface_hub库,可以通过一下命令安装:
pip install huggingface_hub
在Python脚本开头、刚才设置的环境变量之下输入下面的指令,并且粘贴Token进去:
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
import huggingface_hub
huggingface_hub.login("你的Token")
方式二:hdf方法
hdf的GitHub项目详细地址:链接:Huggingface Model Downloader
该方法的好处在于下载能多线程,下载速度很快。
1.安装hfd.sh
wget https://hf-mirror.com/hfd/hfd.sh
2.给它运行权限
chmod a+x hfd.sh
3.设置环境变量
Linux系统:
export HF_ENDPOINT=https://hf-mirror.com
Windows系统
打开Windows Powershell(管理员)
$env:HF_ENDPOINT = "https://hf-mirror.com"
4.使用 aria2c 和多线程下载 网速超快且不会断连
sudo apt-get install aria2
5.cd进入要clone的文件夹
./hfd.sh 模型名称 --tool aria2c -x 4
hfd的具体用法:
hfd <model_id> [--exclude exclude_pattern] [--hf_username username] [--hf_token token] [--tool wget|aria2c] [-x threads] [--dataset]
参数:
- model_id: 用于指定想要下载的模型或数据集的Hugging Face标识符,格式通常为’repo/model_name’。例如bigscience/bloom-560m。
- --exclude (exclude_pattern): 可选参数,用于指定下载时要排除的文件模式。匹配此模式的文件将不会被下载。例如,使用–exclude safetensors会排除所有名字中包含safetensors的文件。
- --hf_username: 可选参数,Hugging Face账户的用户名。如果需要验证才能下载某些模型或数据集,需要提供此参数。
- --hf_token: 可选参数,Hugging Face账户的访问令牌。配合–hf_username使用,用于验证下载。
- --tool: 可选参数,指定下载工具。可以是wget(默认)或aria2c。aria2c支持多线程下载,可能更快。
- -x: 可选参数,仅当使用aria2c时有效。用于指定下载时的线程数。例如-x 8表示使用8个线程下载。
- --dataset: 可选参数,用来标记下载的是数据集而非模型。如果要下载的是数据集,需要添加此参数。
热门推荐
探索秦淮八艳之首:秦淮河畔的风华
刘林的冰雪奇缘:从滑雪小白到教练的蜕变之路
庄辉院士:消除乙肝最新进展——直面挑战,迎接曙光
如何减慢你的心跳速度
千年无锡地域审美与东方美学之重构 ——评央视春节晚会无锡分会场《无锡景 家国情》
《甄嬛传》:看懂了安陵容的一生,我才明白了她的“心机”
法定继承的顺序及分配原则有哪些
加拿大死亡证明海牙认证Apostille怎么办?
智创融合 浴时俱进:2024年热水器行业发展大会顺利召开
9部待播仙侠剧:旧套路上的新审美?(附高口碑仙侠小说列表)
凉拌豆腐的做法简单又好吃(拌豆腐最好吃6道做法,简单实用)
Excel数据在PPT中作图的详细步骤和技巧
天然的力量:药食同源植物在现代健康领域的崛起
Excel表格怎么设置自动提醒功能
什么运动对心脏最健康?研究发现,排名第一的是它→
克隆技术的利与弊:伦理、法律与社会影响的全面探讨
A股新股发行价全球最贵:炒小炒新炒题材现象剖析
哈士奇犬最聪明(探究哈士奇犬的智商基因与训练技巧)
日本再生硅牙膏真的能补牙洞吗?从成分到原理的全面解析
日本再生硅牙膏真的能补牙洞吗?专家解析其成分与效果
书法鉴赏的十二个关键点
如何使用 Hiren 的 BootCD PE 创建可启动 USB
原始盖欧卡团战指南:CP、克星、技能
跑步8年,对一个人的终极意义是什么?
四季桂的守护者:战胜病害,焕发生机
新房交付,空调应该怎么选?中央空调、立式空调和壁挂空调浅谈
量子通信与人工智能:电子战装备升级的新引擎
假期旅游舆情分析:如何选择适合的旅行目的地
集成产品开发(IPD)在汽车电子研发中的应用与发展
如何解读“三奇”命格的吉凶与影响