问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

RWKV社区8月动态:发布中文小说模型、日语模型及embedding模型

创作时间:
作者:
@小白创作中心

RWKV社区8月动态:发布中文小说模型、日语模型及embedding模型

引用
CSDN
1.
https://blog.csdn.net/rwkvteam/article/details/141724086

2024年8月,RWKV社区在模型开发、社区项目和学术研究等方面取得了重要进展。以下是RWKV社区8月的主要动态:

RWKV官方动态

发布RWKV-6-ChnNovel中文小说模型

2024年8月3日起,RWKV社区陆续发布了1B6/3B/7B/14B四种参数的RWKV-6-ChnNovel系列中文小说模型,及对应的小说扩写state。

RWKV-6小说模型下载链接:https://huggingface.co/BlinkDL/rwkv-6-misc/tree/main

RWKV-6-ChnNovel中文小说模型基于RWKV-6-World基底模型微调,微调数据包含中文小说数据和指令(instruction)数据。相较于RWKV-6基底模型,RWKV-6中文小说模型在小说续写、小说扩写以及进行深层次的角色扮演功能上有非常好的效果。

发布RWKV-6-Jpn日语微调模型

RWKV发布7B/14B两种参数的RWKV-6-Jpn日语微调模型。

RWKV-6-Jpn下载地址:https://huggingface.co/BlinkDL/rwkv-6-misc

RWKV-6-Jpn系列日语模型由社区成员@OpenMOSE进行RLHF后,在日语任务上表现更好。OpenMOSE发布的基准测试显示:RLHF后RWKV-6-Jpn7B日语模型可与其他70B的Transformer模型媲美。

RWKV中文官网新增pip库使用指南与提示词指南

RWKV官网的中文文档新增了聊天、续写两种模式的提示词指南与RWKV pip库使用指南。“RWKV提示词指南”介绍了如何向RWKV提问,包括完成任务、角色扮演等方面内容。“RWKV pip库使用指南”将指引你使用RWKV pip库开发基于RWKV模型的应用。

RWKV社区项目

RWKV Runner项目更新

RWKV Runner更新了v1.8.7版本,此版本调整了兼容性和UI界面,并新增了function call等功能:

  • 新增了函数调用(function call)功能(由RWKV社区成员@EliwiiKeeya贡献)
  • 在窄屏页面上添加悬浮Web导航(由RWKV社区成员@HaloWang贡献)
  • 发布了RWKV Runner Windows安装器。Windows安装器有完整的、正式的安装流程:会自动创建目录放置依赖,自动创建快捷方式启动,且自带卸载程序
  • Completion续写页面已支持调整penalty_decay参数

社区发布rwkv6 embedding模型

RWKV社区发布了rwkv6_emb_4k_base嵌入模型(embedding model),这是一个使用中文查询/上下文数据进行微调的Bi-Encoder,主要用于将文本转换成嵌入向量。

rwkv6_emb_4k_base下载链接:https://huggingface.co/yueyulin/rwkv6_emb_4k_base

此外社区也发布了另一款RWKV-6嵌入模型rwkv6_crossencoder,这是基于RWKV-6架构的Cross-Encoder(交叉编码器)。Cross-Encoder既可以用于生成嵌入向量的embedding任务,也可以用于重排序查询/上下文检索的Rerank任务。

rwkv6_crossencoder下载地址:https://huggingface.co/yueyulin/rwkv6_crossencoder

RWKV学术研究相关

Music-Diff音乐生成模型

来自大连理工大学的研究团队提出了Music-Diff架构,该架构引入了Joint Semantic Pre-training方法来执行多变量扰动,并引入了多分支降噪器“Symb-RWKV”模型来恢复联合分布的噪声(通过Pareto优化来适应多个噪声目标)。

实验表明,与语言模型相比,在音符和语义层面进行扰动的联合概率扩散模型可以提供更多样本多样性和组成规律性。

Music-Diff论文地址https://arxiv.org/abs/2408.01950

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号