Hugging Face模型查找与使用指南
创作时间:
作者:
@小白创作中心
Hugging Face模型查找与使用指南
引用
CSDN
1.
https://m.blog.csdn.net/weixin_43815222/article/details/144219443
本文详细介绍了如何在Hugging Face平台上查找和使用模型,特别是针对自然语言处理(NLP)任务的模型。内容包括模型的查找方法、使用方法、命名规则以及模型的具体结构和保存方式。
一、如何找到统一使用方法
对于文字处理,可以使用AutoTokenizer,具体操作如下:
- 在模型页面找到需要的模型并点击
- 点击最右边的"Use in Transformers"
二、如何找到本模型使用方法
滑到页面底部查看使用说明,通常会提供PyTorch的使用方法,以及其他框架的说明。
其中字符串名字可以为路径。
三、两种使用方法结果对比
使用RobertaTokenizer和AutoTokenizer的结果是一样的:
# 使用 RobertaTokenizer
tokenizer = RobertaTokenizer.from_pretrained(pretrained_model_path)
inputs = tokenizer("对比原始的分词和最新的分词器", return_tensors="pt")
print(inputs['input_ids'])
# 使用 AutoTokenizer
auto_tokenizer = AutoTokenizer.from_pretrained(pretrained_model_path)
auto_inputs = auto_tokenizer('对比原始的分词和最新的分词器', return_tensors='pt')
print(auto_inputs['input_ids'])
四、模型详解
以NER模型为例:
from transformers import AutoTokenizer, AutoModelForTokenClassification, pipeline
tokenizer = AutoTokenizer.from_pretrained("uer/roberta-base-finetuned-cluener2020-chinese")
model = AutoModelForTokenClassification.from_pretrained("uer/roberta-base-finetuned-cluener2020-chinese")
ner_pipeline = pipeline("ner", model=model, tokenizer=tokenizer)
ner_pipeline("马云是阿里巴巴的创始人,他住在中国杭州。")
这两行代码的作用是:
- 加载与模型匹配的分词器(tokenizer)
- 加载预训练的模型
五、模型文件格式
- tf_model.h5:TensorFlow框架的模型文件,保存了模型结构和权重
- flax_model.msgpack:Flax框架的模型文件,保存了模型参数
六、模型保存为.pt格式
可以使用PyTorch保存模型:
import torch
# 保存整个模型
torch.save(model, "./model.pt")
# 保存模型权重
torch.save(model.state_dict(), "model.pt")
七、模型结构
以RobertaForTokenClassification为例:
RobertaForTokenClassification(
(roberta): RobertaModel(
(embeddings): RobertaEmbeddings(
...
)
(encoder): RobertaEncoder(
...
)
(pooler): RobertaPooler(
...
)
)
(classifier): Linear(in_features=768, out_features=11, bias=True)
)
这个模型包括词嵌入层、编码器层和分类头,用于命名实体识别任务。
热门推荐
清朝内阁的职责与运作方式
南加州大学医学专业毕业要求高吗
气郁体质吃什么有效
书法性空间与写意画笔墨书写意味的交融——从“写”的艺术性探析
篆刻基础:王冕,第三代宗师
老年人腿软、使不上劲?提醒:补充这3种营养,走起路来腿更 ...
白萝卜焖牛腩:一道传统美食的制作与文化传承
皮肤病患者的心灵慰藉:以积极心态面对挑战
认知策略:包含哪几种,助你智慧升级
绍兴旅行全指南:交通景点美食住宿一手掌握
老房装修必备!智能电动窗帘攻略大揭秘!智能电动窗帘要不要装?
如何评估一套房屋的购买必要性?
静脉曲张治疗全解析:国际公认疗法与CHIVA创新技术
基因的探索史
分析:全球资本市场大变迁悄然上演 中国资产受追捧
大S单身女王霸气回归!财富自由,桃花不断,再婚?她笑言:不过是人生另一站
中国电影产业研究报告发布:新主流电影发展成就与挑战并存
帆布袋世界流行
微信聊天记录迁移:详细操作指南
广州龙狮男篮:没钱,为什么不卖掉球队?还想尽办法回血经营
巴塞罗那与拉斯帕尔马斯:西甲的对决
学起来津津有味!这门课用成语展现中国文化的独有魅力!
中国传统服饰:文化的遗产与时尚的复兴
【丹凝中医】得了肩周炎,中医治疗和日常训练全攻略
九里香叶子发黄掉叶子是什么原因?
膀胱过度活动症:症状、患病率及治疗方法全解析
颈动脉内膜剥脱术:原理、过程与未来展望
志愿军戴大檐帽?美军步坦协同?还原第9兵团和杨根思的佳作上映
吃什么去水肿
安徽医科大学第一附属医院:一院三区协同发展,综合实力稳居安徽前茅