资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

VBDeepSeek：使用AI大模型生成四级单词学习资料的开源工具

创作时间:

作者:

@小白创作中心

VBDeepSeek：使用AI大模型生成四级单词学习资料的开源工具

引用

来源

https://www.aisharenet.com/vbdeepseek/

VBDeepSeek是一个基于AI大模型开发的开源项目，旨在帮助英语学习者高效掌握大学英语四级（CET-4）词汇。该项目通过Python脚本结合AI大模型的强大语言生成能力，自动生成包含词义、词根、例句及记忆技巧的词汇学习资料。

功能列表

自动生成四级词汇学习资料：调用AI大模型接口，生成单词的词义、词根分析、例句和记忆技巧。
按字母分类存储：将CET-4单词按首字母分为A到Z的JSON文件，便于查找和管理。
助记图片生成：通过脚本生成单词相关的助记图像，提升记忆效果。
文章生成工具：生成以字母开头的Markdown格式词汇学习文章，适合博客或笔记整理。
开源代码支持：提供完整Python代码，用户可自由修改或扩展功能。

使用帮助

安装流程

“Vocabulary Book by DeepSeek”是一个基于Python的工具，需要一定的编程环境配置才能运行。以下是详细的安装和使用步骤：

1. 环境准备

安装Python：确保系统安装了Python 3.8或以上版本，可在Python官网下载安装。
克隆项目：打开终端或命令行，输入以下命令将项目下载到本地：

git clone https://github.com/vxiaozhi/vocabulary-book-by-deepseek.git
cd vocabulary-book-by-deepseek

安装依赖：项目依赖若干Python库，运行以下命令安装：

pip install -r requirements.txt

若没有requirements.txt，可手动安装核心库：

pip install requests openai pillow

配置AI大模型API：需要AI大模型的API密钥。注册AI大模型账号后，在平台上获取密钥，将其填入项目配置文件或代码中的API调用部分。

2. 使用主要功能

项目包含两个核心脚本：单词助记工具和助记图片生成工具。以下是详细操作流程：

（1）生成单词学习资料

准备单词数据：项目默认提供data/cet4/目录下按字母A-Z分类的JSON文件（如A.json、B.json）。每个文件包含对应字母开头的单词列表。
运行脚本：
打开终端，进入项目目录。
执行以下命令生成单词分析：

python cet4_word_helper.py

脚本会读取data/cet4/中的单词，通过AI大模型API生成词义、词根、例句和记忆技巧，结果保存至result/cet4/目录下的JSON文件（如A.json）。
查看结果：生成的JSON文件结构示例：

{
"word": "abandon",
"meaning": "放弃",
"root": "a-(加强) + bandon(控制)",
"example": "He had to abandon his car in the snow.",
"memory_tip": "想象一个人在雪地里放弃aband控制on车。"
}

（2）生成助记图片

运行图片生成脚本：
执行以下命令：

python gen_words_img.py

脚本会根据result/cet4/中的单词数据生成助记图片，默认保存至指定目录（需在脚本中配置输出路径）。
自定义设置：修改gen_words_img.py中的参数，例如图片大小、分辨率或样式，确保生成符合需求的图片。

（3）生成词汇文章

运行文章生成脚本：
执行：

python gen_articles.py

脚本读取result/cet4/中的JSON文件，生成26个Markdown文件（如2025-02-11-cet4-A.md），保存至result/cet4_articles/目录。
输出格式：每个文件包含字母开头单词的分析，适合学习或分享。例如：

---
title: "四级词汇-A开头单词"
date: 2025-02-11
---
## abandon
词义：放弃  
词根：a-(加强) + bandon(控制)  
例句：He had to abandon his car in the snow.  
记忆技巧：想象一个人在雪地里放弃aband控制on车。

3. 操作注意事项

API密钥安全：不要将AI大模型API密钥直接硬编码到脚本中，建议使用环境变量存储：

export AI_API_KEY='你的密钥'

网络连接：运行脚本时需确保网络畅通，因依赖AI大模型API。
文件路径检查：若data/cet4/或result/cet4/目录缺失，需手动创建或调整脚本路径配置。
扩展功能：可根据需求修改代码，例如增加六级单词支持或调整输出格式。

4. 特色功能操作

批量处理：一次性生成所有字母的单词资料，仅需运行一次主脚本。
图片辅助记忆：生成的助记图片可导入电子笔记或打印，配合文字学习。
文章分享：Markdown文件可直接用于博客发布或导入Notion等工具整理学习笔记。

Cline 任务提示词

Task1

用 Python 写一个 cet4 单词助记工具，对单词进行词义词根分析、例举例句、并提供一些高效的记忆技巧和窍门。 详细需求如下：
1. 单词已经按照字母归类存储在data/cet4/目录下，分别为： A.json B.json ... Z.json
2. 读取每一个 data/cet4/目录下 每个JSON文件中的所有单词，对每个单词调用AI大模型的接口生成该单词的词义、词根、例句、记忆技巧信息。
3. 生成的单词信息保存到 result/cet4/目录下，分别为： A.json B.json ... Z.json

Task2

用 Python3.8 写一个单词助记图片生成工具gen_words_img.py， 详细需求如下：
1. 读取每一个 result/cet4/目录下 每个JSON文件中的所有单词信息，每个单词信息包括word、analysis、draw_explain、draw_prompt 4个字段。
2. 对每个单词调用replicate的接口(接口具体实现在provider_replicate.py:replicate_run)生成该单词的图片。
3. 生成的图片文件保存到 result/cet4_imgs/目录下，文件名称格式为：{first_letter_of_word}/{word}.jpg。如果对应图片文件已存在，则跳过本图片文件的生成。
4. 假设所有依赖库已经安装。

Task3

用 Python3.8 写一个文章生成工具gen_articles.py， 为26个英文字母各生成一个文件，共26个文件，文件名格式为：2025-02-11-cet4-{letter}.md, 每个文件的内容组成如下：
"""
---
layout:     post
title:      "四级词汇-{letter}开头单词"
subtitle:   "四级词汇-{letter}开头单词"
date:       2025-02-11
author:     "vxiaozhi"
catalog: true
tags:
- english
- cet4
---
{{ for all word begin with letter}}
## word
{word.analysis}
{{end}}
"""
其中 word.analysis 通过读取 result/cet4/{letter}.json 获得，result/cet4/{letter}.json存储了{letter}开头的全部单词的信息，如果result/cet4/{letter}.json 不存在，则跳过该letter对应文件的生成。
更多约束如下：
1、2025-02-11-cet4-{letter}.md 保存到 result/cet4_articles 目录下。
2、Python 使用 3.8 版本。
3、假设所有Python依赖库已经安装。

热门推荐

万千精灵坠落人间华南植物园开启禾雀花模式