Trie树-字典树笔记
创作时间:
作者:
@小白创作中心
Trie树-字典树笔记
引用
1
来源
1.
https://www.cnblogs.com/dianman/p/18579954
Trie树(字典树)是一种用于存储字符串的高效数据结构,特别适用于处理大量字符串的前缀匹配和查找问题。通过将字符串的公共前缀合并存储,Trie树能够在较低的时间复杂度内完成字符串的插入和查找操作。本文将详细介绍Trie树的基本原理,并通过代码示例展示其具体实现方法。
Trie树是一种高效的存储字符串的数据结构,它将多个字符串的前缀合并在一条边上,每次插入时,都判断当前的树上有无能够重合的前缀,如果没有就单独增加一个节点。通过合并前缀,可以做到快速查找已经优化空间的操作。
下面是使用数组模拟实现Trie树的部分代码:
我们首先定义一个二维数组来构造一个树结构
int tree[N][M];//N表示该树最多有几个节点,M表示每个节点最多伸出多少个枝,即最多有多少个儿子
int idx;//定义编号指针
int cnt[N];//定义计数数组,表示第N个节点到根节点的路径构成的字符串被插入了多少次
转换字符操作:将字符转换为整数,作为树的枝(以字母和数字为例)
int trans(char x) {
if (x >= 'A' && x <= 'Z') return x - 'A';//映射大写字母到 0~25
if (x >= 'a' && x <= 'z') return x - 'a' + 26;//映射小写字母到 26~51
if (x >= '0' && x <= '9') return x - '0' + 52;//映射数字到 52~61
}
插入字符串操作:
void insert(char str[]) {//插入str这个字符串
int p = 0, len = strlen(str);//从根节点出发
for (int i = 0; i < len; i++) {//遍历字符串
int c = trans(str[i]);//转换字符映射到整数
if (!tree[p][c])//如果当前节点不存在 c 这个儿子(树枝)
tree[p][c] = ++idx;//创建这个枝,然后给予编号
p = tree[p][c];//走到这个节点
cnt[p]++;//当前p节点到根节点的路径构成的字符串被插入次数加1
}
}
查找字符串操作:(也可以查找前缀)
int find(char str[]) {
int p = 0, len = strlen(str);//从根节点开始查找
for (int i = 0; i < len; i++) {
int c = trans(str[i]);
if (!tree[p][c])//如果当前节点不存在 c 这个儿子
return 0;//返回0,没有找到匹配的浅醉
p = tree[p][c];//存在 c 这个儿子,那么就走到 c 这个儿子节点上
}
return cnt[p];//遍历完需要查找的字符串,返回最后一个字符对应的插入的次数
}
以洛谷P8306为例:
#include <stdio.h>
#include <iostream>
#include <string.h>
using namespace std;
int n, q, idx;
char s[3000010];
int tree[3000010][65], cnt[3000010];
int trans(char x) {
if (x >= 'A' && x <= 'Z') return x - 'A';
if (x >= 'a' && x <= 'z') return x - 'a' + 26;
if (x >= '0' && x <= '9') return x - '0' + 52;
}
void insert(char str[]) {
int p = 0, len = strlen(str);
for (int i = 0; i < len; i++) {
int c = trans(str[i]);
if (!tree[p][c])
tree[p][c] = ++idx;
p = tree[p][c];
cnt[p]++;
}
}
int find(char str[]) {
int p = 0, len = strlen(str);
for (int i = 0; i < len; i++) {
int c = trans(str[i]);
if (!tree[p][c])
return 0;
p = tree[p][c];
}
return cnt[p];
}
int main()
{
int t;
scanf("%d", &t);
while (t--) {
for (int i = 0; i <= idx; i++)
for (int j = 0; j <= 64; j++)
tree[i][j] = 0;
for (int i = 0; i <= idx; i++)
cnt[i] == 0;
idx = 0;//做完一轮测试后,重新初始化tree
scanf("%d %d", &n, &q);
for (int i = 0; i < n; i++) {
scanf("%s", s);
insert(s);
}
for (int i = 0; i < q; i++) {
scanf("%s", s);
printf("%d\n", find(s));
}
}
return 0;
}
热门推荐
河南3岁男童被恶犬咬伤18天不幸离世!规范化处置到底有多重要!
2024年薪酬报告揭示:ESG岗位需求激增,引领企业可持续发展
平姓的起源和来历,平氏家谱字辈查询
平姓的起源和来历,平氏家谱字辈查询
澳洲大城市和小城市的生活成本差别有多大?
新手开车遇到交通事故怎么处理?按这样的步骤来操作错不了
编程中echo命令详解:基本概念、应用场景及优化技巧
西安适合踏青、野餐、遛娃的十大公园,你去过哪几个?
曹丕文学理论著作
CAN 协议(Controller Area Network)详解
腹痛是否可以通过B超检查确定原因
洗衣机选购全攻略:从类型到性价比,一文读懂如何挑选洗衣机
什么是电池储存温度?详解其定义、影响因素及优化建议
权威推荐:早餐营养保障的最佳配餐食物
糖链抗原15-3值多少才是癌症
初学者如何选择适合自己的镜头:穷人三宝、小三元还是大三元?
一碗麻酱凉面热量破500大卡!凉面健康吃法 热量少200大卡
普洱茶存储指南:怎样控制温湿度以提升品质
无线信号不好怎么增强?有效提升网络覆盖的方法有哪些?
《黑月光拿稳BE剧本》:黎苏苏与澹台烬的爱恨纠葛
时间序列预测模型和随机森林预测模型原理与应用对比
2024河北历史570分能上什么大学?
最安全的跑步,怎么就成了高危运动
“信口雌黄”:一个成语背后的历史故事
弦论末日?揭秘宇宙最深奥理论的命运之谜!
合肥2月新房价格近期首次环比上涨 专家预测:未来几个月或出现一波“购房热”
时至处暑话枸杞(跟着节气识草药)
什么是ρ-Lipschitz连续性?有什么作用?
Excel提取多个工作簿数据的多种方法
数据 | 脱口秀选手中的“她”含量