用VBA简化Excel办公流程
创作时间:
作者:
@小白创作中心
用VBA简化Excel办公流程
引用
360doc个人图书馆
等
9
来源
1.
http://www.360doc.cn/article/78873848_1026234072.html
2.
https://blog.csdn.net/renyongzhe/article/details/126793884
3.
https://blog.csdn.net/dyfgs/article/details/7177088
4.
https://baijiahao.baidu.com/s?id=1769392456681844325
5.
https://baijiahao.baidu.com/s?id=1802273530418543341
6.
https://blog.csdn.net/u010454729/article/details/124231419
7.
https://blog.csdn.net/zhangdabai1/article/details/142214759
8.
https://www.cnblogs.com/-wenli/p/11079173.html
9.
https://docs.pingcode.com/baike/4975684
通过掌握VBA语言的字符串处理技巧,你可以显著提高在Excel中的工作效率。无论是数据清洗、文本分析还是报表生成,VBA都能帮助你轻松应对各种复杂的办公任务。例如,使用Left、Right和Mid函数提取特定字符,或者利用Replace函数批量替换错误信息,这些操作都可以大大减少手动处理的时间。此外,VBA还提供了丰富的内置函数来实现大小写转换、字符串查找等功能,让你的工作更加高效便捷。
下面为你封装一组进阶的文本处理函数:
'► 文本相似度计算
Public Function SimilarityRatio(ByVal str1 As String, ByVal str2 As String) As Double
'基于编辑距离计算相似度(0-1范围)
Dim maxLen As Long
str1 = CleanString(str1) '假设已实现基础清洁函数
str2 = CleanString(str2)
If str1 = str2 Then
SimilarityRatio = 1
Exit Function
End If
maxLen = WorksheetFunction.Max(Len(str1), Len(str2))
SimilarityRatio = 1 - (LevenshteinDistance(str1, str2) / maxLen)
End Function
'► 莱文斯坦距离计算
Public Function LevenshteinDistance(ByVal s As String, ByVal t As String) As Long
'动态规划实现编辑距离
Dim d() As Long, i As Long, j As Long, cost As Long
Dim m As Long, n As Long
m = Len(s)
n = Len(t)
ReDim d(0 To m, 0 To n)
For i = 0 To m: d(i, 0) = i: Next
For j = 0 To n: d(0, j) = j: Next
For i = 1 To m
For j = 1 To n
cost = Abs(StrComp(Mid(s, i, 1), Mid(t, j, 1), vbTextCompare))
d(i, j) = WorksheetFunction.Min( _
d(i - 1, j) + 1, _
d(i, j - 1) + 1, _
d(i - 1, j - 1) + cost)
Next
Next
LevenshteinDistance = d(m, n)
End Function
'► 模糊匹配查找
Public Function FuzzyMatch(ByVal searchStr As String, ByVal rangeToSearch As Range, Optional threshold As Double = 0.7) As Variant
'返回匹配单元格地址及相似度二维数组
Dim result() As Variant, cell As Range, cnt As Long
ReDim result(1 To rangeToSearch.Count, 1 To 2)
searchStr = CleanString(searchStr)
For Each cell In rangeToSearch
If SimilarityRatio(searchStr, CleanString(cell.Value)) >= threshold Then
cnt = cnt + 1
result(cnt, 1) = cell.Address
result(cnt, 2) = Format(SimilarityRatio(searchStr, cell.Value), "0.00%")
End If
Next
ReDim Preserve result(1 To cnt, 1 To 2)
FuzzyMatch = result
End Function
'► Jaccard相似度计算
Public Function JaccardSimilarity(ByVal strA As String, ByVal strB As String) As Double
'基于词集的相似度计算
Dim wordsA As Variant, wordsB As Variant
Dim union As Collection, intersect As Collection
Set union = New Collection
Set intersect = New Collection
wordsA = Split(RemoveNonAlphanumeric(strA), " ") '假设已实现基础处理函数
wordsB = Split(RemoveNonAlphanumeric(strB), " ")
'计算并集和交集
BuildUnionAndIntersect wordsA, wordsB, union, intersect
If union.Count = 0 Then
JaccardSimilarity = 0
Else
JaccardSimilarity = intersect.Count / union.Count
End If
End Function
'► 私有辅助方法 ◄
Private Sub BuildUnionAndIntersect(ByRef arr1, ByRef arr2, ByRef unionColl As Collection, ByRef intersectColl As Collection)
Dim dict As Object, elem As Variant
Set dict = CreateObject("Scripting.Dictionary")
'处理第一个数组
For Each elem In arr1
elem = LCase(Trim(elem))
If Len(elem) > 0 Then
dict(elem) = 1
AddToCollection unionColl, elem
End If
Next
'处理第二个数组
For Each elem In arr2
elem = LCase(Trim(elem))
If Len(elem) > 0 Then
If dict.exists(elem) Then
If dict(elem) = 1 Then
AddToCollection intersectColl, elem
dict(elem) = 2
End If
Else
AddToCollection unionColl, elem
End If
End If
Next
End Sub
Private Sub AddToCollection(ByRef coll As Collection, ByVal item As String)
'去重添加元素
On Error Resume Next
coll.Add item, item
On Error GoTo 0
End Sub
使用示例:
Sub Demo()
'相似度计算
Debug.Print SimilarityRatio("apple", "apples") '→ 0.8
'模糊匹配查找
Dim matches As Variant
matches = FuzzyMatch("Excel", Range("A1:A10"), 0.6)
'Jaccard相似度
Debug.Print JaccardSimilarity("Hello world", "World hello") '→ 1.0
End Sub
特点说明:
性能优化:莱文斯坦距离使用动态规划算法,处理20字符以内的字符串效率较高
预处理集成:内置CleanString函数(需与您的基础函数整合)进行统一预处理
扩展性设计:模糊匹配函数可直接应用于Excel单元格区域
阈值控制:所有相似度计算均可设置灵敏度阈值
兼容处理:统一使用vbTextCompare进行不区分大小写的比较
注意:需确保已实现引用的基础函数(CleanString、RemoveNonAlphanumeric等),可添加错误处理增强健壮性。对于大数据量场景建议结合数组处理优化性能。
热门推荐
青皮红肉鱼背后的组胺隐患
纪念钱伟长诞辰111周年:一位心系祖国的“斗士”
自制油浸金枪鱼罐头
17种机器学习回归算法在金融的应用
二型糖尿病喝什么茶最好
GPU算力池的构建与优化策略及其在人工智能应用中的重要性
不同省份的省考联考试卷是否一样呢
想做自媒体博主赚钱的人,90%都放弃了
学费每年30万以内的美国大学精选,这8所值得一申!
一份司法建议如何撬动野生动物保护大合力?
“量身定制”四个版本酸梅汤,浙江三甲医院“卷”起中药茶饮
如何确保资金转移的安全性?这种安全性的保障措施有哪些?
臭氧消毒的应用领域
新手入门:如何调整机械和电子变速前拨
黄鳝怎么繁殖?从自然习性到人工孵化的全面解析
黄鳝怎么繁殖?
数据分析实习是什么工作
十大最好吃的鱼干鱼排名
保险315|“大消保”格局下,保险机构多措并举守护金融消费者权益
花园城市“种子计划”启动 激发居民参与社区建设热情
张爱玲《红玫瑰与白玫瑰》:死要面子活受罪的男人,既苦了自己,又负了枕边人
解读中国醋酸甲酯产业链:从原料到应用的全景解析
乙酸钾的安全性如何?有毒吗?
电动牙刷品控不佳、营销被质疑套路,usmile的路还有多远?
推动文化出海,中国文化和旅游IP授权系列活动举办
中国家庭常用“铝扣板”作吊顶,但都没坚持“5选5不选”,很吃亏
2024年全国机动车保有量等最新权威数据发布
千焦与千卡的换算
胆小的人怎样才能变胆大
DeepSeek模型在健康管理中的疾病风险评估应用探索