VBDeepSeek:使用AI大模型生成四级单词学习资料的开源工具
创作时间:
作者:
@小白创作中心
VBDeepSeek:使用AI大模型生成四级单词学习资料的开源工具
引用
1
来源
1.
https://www.aisharenet.com/vbdeepseek/
VBDeepSeek是一个基于AI大模型开发的开源项目,旨在帮助英语学习者高效掌握大学英语四级(CET-4)词汇。该项目通过Python脚本结合AI大模型的强大语言生成能力,自动生成包含词义、词根、例句及记忆技巧的词汇学习资料。
功能列表
- 自动生成四级词汇学习资料:调用AI大模型接口,生成单词的词义、词根分析、例句和记忆技巧。
- 按字母分类存储:将CET-4单词按首字母分为A到Z的JSON文件,便于查找和管理。
- 助记图片生成:通过脚本生成单词相关的助记图像,提升记忆效果。
- 文章生成工具:生成以字母开头的Markdown格式词汇学习文章,适合博客或笔记整理。
- 开源代码支持:提供完整Python代码,用户可自由修改或扩展功能。
使用帮助
安装流程
“Vocabulary Book by DeepSeek”是一个基于Python的工具,需要一定的编程环境配置才能运行。以下是详细的安装和使用步骤:
1. 环境准备
- 安装Python:确保系统安装了Python 3.8或以上版本,可在Python官网下载安装。
- 克隆项目:打开终端或命令行,输入以下命令将项目下载到本地:
git clone https://github.com/vxiaozhi/vocabulary-book-by-deepseek.git
cd vocabulary-book-by-deepseek
- 安装依赖:项目依赖若干Python库,运行以下命令安装:
pip install -r requirements.txt
若没有requirements.txt
,可手动安装核心库:
pip install requests openai pillow
- 配置AI大模型API:需要AI大模型的API密钥。注册AI大模型账号后,在平台上获取密钥,将其填入项目配置文件或代码中的API调用部分。
2. 使用主要功能
项目包含两个核心脚本:单词助记工具和助记图片生成工具。以下是详细操作流程:
(1)生成单词学习资料
- 准备单词数据:项目默认提供
data/cet4/
目录下按字母A-Z分类的JSON文件(如A.json
、B.json
)。每个文件包含对应字母开头的单词列表。 - 运行脚本:
- 打开终端,进入项目目录。
- 执行以下命令生成单词分析:
python cet4_word_helper.py
- 脚本会读取
data/cet4/
中的单词,通过AI大模型API生成词义、词根、例句和记忆技巧,结果保存至result/cet4/
目录下的JSON文件(如A.json
)。 - 查看结果:生成的JSON文件结构示例:
{
"word": "abandon",
"meaning": "放弃",
"root": "a-(加强) + bandon(控制)",
"example": "He had to abandon his car in the snow.",
"memory_tip": "想象一个人在雪地里放弃aband控制on车。"
}
(2)生成助记图片
- 运行图片生成脚本:
- 执行以下命令:
python gen_words_img.py
- 脚本会根据
result/cet4/
中的单词数据生成助记图片,默认保存至指定目录(需在脚本中配置输出路径)。 - 自定义设置:修改
gen_words_img.py
中的参数,例如图片大小、分辨率或样式,确保生成符合需求的图片。
(3)生成词汇文章
- 运行文章生成脚本:
- 执行:
python gen_articles.py
- 脚本读取
result/cet4/
中的JSON文件,生成26个Markdown文件(如2025-02-11-cet4-A.md
),保存至result/cet4_articles/
目录。 - 输出格式:每个文件包含字母开头单词的分析,适合学习或分享。例如:
---
title: "四级词汇-A开头单词"
date: 2025-02-11
---
## abandon
词义:放弃
词根:a-(加强) + bandon(控制)
例句:He had to abandon his car in the snow.
记忆技巧:想象一个人在雪地里放弃aband控制on车。
3. 操作注意事项
- API密钥安全:不要将AI大模型API密钥直接硬编码到脚本中,建议使用环境变量存储:
export AI_API_KEY='你的密钥'
- 网络连接:运行脚本时需确保网络畅通,因依赖AI大模型API。
- 文件路径检查:若
data/cet4/
或result/cet4/
目录缺失,需手动创建或调整脚本路径配置。 - 扩展功能:可根据需求修改代码,例如增加六级单词支持或调整输出格式。
4. 特色功能操作
- 批量处理:一次性生成所有字母的单词资料,仅需运行一次主脚本。
- 图片辅助记忆:生成的助记图片可导入电子笔记或打印,配合文字学习。
- 文章分享:Markdown文件可直接用于博客发布或导入Notion等工具整理学习笔记。
Cline 任务提示词
Task1
用 Python 写一个 cet4 单词助记工具,对单词进行词义词根分析、例举例句、并提供一些高效的记忆技巧和窍门。 详细需求如下:
1. 单词已经按照字母归类存储在data/cet4/目录下,分别为: A.json B.json ... Z.json
2. 读取每一个 data/cet4/目录下 每个JSON文件中的所有单词,对每个单词调用AI大模型的接口生成该单词的词义、词根、例句、记忆技巧信息。
3. 生成的单词信息保存到 result/cet4/目录下,分别为: A.json B.json ... Z.json
Task2
用 Python3.8 写一个单词助记图片生成工具gen_words_img.py, 详细需求如下:
1. 读取每一个 result/cet4/目录下 每个JSON文件中的所有单词信息,每个单词信息包括word、analysis、draw_explain、draw_prompt 4个字段。
2. 对每个单词调用replicate的接口(接口具体实现在provider_replicate.py:replicate_run)生成该单词的图片。
3. 生成的图片文件保存到 result/cet4_imgs/目录下,文件名称格式为:{first_letter_of_word}/{word}.jpg。如果对应图片文件已存在,则跳过本图片文件的生成。
4. 假设所有依赖库已经安装。
Task3
用 Python3.8 写一个文章生成工具gen_articles.py, 为26个英文字母各生成一个文件,共26个文件,文件名格式为:2025-02-11-cet4-{letter}.md, 每个文件的内容组成如下:
"""
---
layout: post
title: "四级词汇-{letter}开头单词"
subtitle: "四级词汇-{letter}开头单词"
date: 2025-02-11
author: "vxiaozhi"
catalog: true
tags:
- english
- cet4
---
{{ for all word begin with letter}}
## word
{word.analysis}
{{end}}
"""
其中 word.analysis 通过读取 result/cet4/{letter}.json 获得,result/cet4/{letter}.json存储了{letter}开头的全部单词的信息,如果result/cet4/{letter}.json 不存在,则跳过该letter对应文件的生成。
更多约束如下:
1、2025-02-11-cet4-{letter}.md 保存到 result/cet4_articles 目录下。
2、Python 使用 3.8 版本。
3、假设所有Python依赖库已经安装。
热门推荐
椰子油:您应该使用的坚果油
养肝用枸杞,三种搭配效更佳
到底什么是“无网通信”?
身份证改名全流程指南:所需材料与办理步骤详解
7A04是超硬铝合金吗?
“黔”进小课堂 | 贵州矿产知多少?
装备在现代战争中的重要地位与价值
中国科学家Cell突破:二甲双胍“逆转”衰老,新证据来了
蛇为啥会把四肢进化没了
这种食材是“百蛙之王”,可惜如今已难吃到
台积电眼里的晶体管未来
5种瓜营养成分“顶呱呱”,常吃的人身体都不会太差!
律师的合同审查要点及合同的质量标准是怎么样的
当中国传统美学融入仙侠游戏,这场盛宴太惊艳
销售订单管理流程详解:从接收到发货的完整步骤
关于银屑病,你需要知道的这些
柳州螺蛳粉出海记:从街边小吃到全球美食
猫咪最喜欢的居住环境,你家猫住得开心吗?
猫咪是非常敏感又可爱的动物,与它们互动时需要注意方式方法。
电视剧《山海情》为何能出圈,闽宁脱贫故事触动海外观众心弦
罗马民法大全体现的原则及其在现代法律体系中的意义
世界上汇率最低的10种货币,哪些因素导致某些国家的货币汇率特别低?
上海13号线西延伸最新进展,带你了解规划细节!
如何判断一只狗的纯度(从品种特征、血统证书到身体特征)
鬼针草:从民间草药到现代医学的应用
意甲尤文图斯VS维罗纳:近期局势深度解析
常温超导:打开未来科技的大门(超导最全科普)
马拉松训练揭秘:7种高效方法,助你成绩飙升
河南温县:太极之光焕彩 文旅融合出圈
ETF日报:医药板块或将迎来阶段性上涨机会,可关注创新药沪深港ETF