Hugging Face模型查找与使用指南
创作时间:
作者:
@小白创作中心
Hugging Face模型查找与使用指南
引用
CSDN
1.
https://m.blog.csdn.net/weixin_43815222/article/details/144219443
本文详细介绍了如何在Hugging Face平台上查找和使用模型,特别是针对自然语言处理(NLP)任务的模型。内容包括模型的查找方法、使用方法、命名规则以及模型的具体结构和保存方式。
一、如何找到统一使用方法
对于文字处理,可以使用AutoTokenizer
,具体操作如下:
- 在模型页面找到需要的模型并点击
- 点击最右边的"Use in Transformers"
二、如何找到本模型使用方法
滑到页面底部查看使用说明,通常会提供PyTorch的使用方法,以及其他框架的说明。
其中字符串名字可以为路径。
三、两种使用方法结果对比
使用RobertaTokenizer
和AutoTokenizer
的结果是一样的:
# 使用 RobertaTokenizer
tokenizer = RobertaTokenizer.from_pretrained(pretrained_model_path)
inputs = tokenizer("对比原始的分词和最新的分词器", return_tensors="pt")
print(inputs['input_ids'])
# 使用 AutoTokenizer
auto_tokenizer = AutoTokenizer.from_pretrained(pretrained_model_path)
auto_inputs = auto_tokenizer('对比原始的分词和最新的分词器', return_tensors='pt')
print(auto_inputs['input_ids'])
四、模型详解
以NER模型为例:
from transformers import AutoTokenizer, AutoModelForTokenClassification, pipeline
tokenizer = AutoTokenizer.from_pretrained("uer/roberta-base-finetuned-cluener2020-chinese")
model = AutoModelForTokenClassification.from_pretrained("uer/roberta-base-finetuned-cluener2020-chinese")
ner_pipeline = pipeline("ner", model=model, tokenizer=tokenizer)
ner_pipeline("马云是阿里巴巴的创始人,他住在中国杭州。")
这两行代码的作用是:
- 加载与模型匹配的分词器(tokenizer)
- 加载预训练的模型
五、模型文件格式
- tf_model.h5:TensorFlow框架的模型文件,保存了模型结构和权重
- flax_model.msgpack:Flax框架的模型文件,保存了模型参数
六、模型保存为.pt格式
可以使用PyTorch保存模型:
import torch
# 保存整个模型
torch.save(model, "./model.pt")
# 保存模型权重
torch.save(model.state_dict(), "model.pt")
七、模型结构
以RobertaForTokenClassification
为例:
RobertaForTokenClassification(
(roberta): RobertaModel(
(embeddings): RobertaEmbeddings(
...
)
(encoder): RobertaEncoder(
...
)
(pooler): RobertaPooler(
...
)
)
(classifier): Linear(in_features=768, out_features=11, bias=True)
)
这个模型包括词嵌入层、编码器层和分类头,用于命名实体识别任务。
热门推荐
赣事新说|这里,30多名院士、博士都放弃了行政级别
鸡啄蛋有什么解决办法?鸡啄蛋用什么料来改善?养鸡人快来学
世界十大名贵石斑鱼
胰岛素周制剂——糖友治疗新选择
新疆喀什的位置有多重要?周围居然有八个首都,结合地图了解一下
糖尿病患者尿常规肾功能正常还需查微量白蛋白吗?医生这样说
手机进水后的应急处理指南:关机、除水、干燥与维修建议
深度解读:中年危机的真相与应对策略
为什么团队合作的重要性不可忽视?探索其对成功的关键影响
英国租房热点大揭秘,四年房租上涨超40%!未来走势如何?
中型淡水观赏鱼的种类及养殖技巧详解
探讨VIE架构的合法性:全球视角下的考量
有丝分裂和减数分裂的区别对比
2025年高考四大改革政策解读:复读生、英语科目、院校批次等全面调整
成年男性每天摄入热量:科学指南
爱情对人生的意义:十大维度全面解析
行政诉讼起诉流程图:一份详细的诉讼指南
吹空调感冒是风寒还是风热
债基适合长期持有吗?帮你弄懂三大问题
厌氧氨氧化污水处理技术
双鱼座恋爱脑最明显:揭开TA们为爱痴狂的秘密
一尊酹江月,得失寸心知——从“酹”字解读苏轼《念奴娇·赤壁怀古》的情感
插画的高级感如何体现,尽量精简构图、配色不能过多
奴隶制引发的时代纷争:社会、经济及文化影响
中西合璧降压妙方:天麻钩藤饮
坏消息,斯特劳瑟在掘金惜败凯尔特人比赛中一瘸一拐地离开了球场
增材制造Gyroid多孔结构混合梯度对力学及失效特性的影响
全面了解股票分红、扣税、除权除息规则:XD、XR、DR
人体解剖学基础 | 膝关节
四川冬季滑雪胜地与特色玩雪景点一览:热门推荐与深度游指南