用VBA简化Excel办公流程
创作时间:
作者:
@小白创作中心
用VBA简化Excel办公流程
引用
360doc个人图书馆
等
9
来源
1.
http://www.360doc.cn/article/78873848_1026234072.html
2.
https://blog.csdn.net/renyongzhe/article/details/126793884
3.
https://blog.csdn.net/dyfgs/article/details/7177088
4.
https://baijiahao.baidu.com/s?id=1769392456681844325
5.
https://baijiahao.baidu.com/s?id=1802273530418543341
6.
https://blog.csdn.net/u010454729/article/details/124231419
7.
https://blog.csdn.net/zhangdabai1/article/details/142214759
8.
https://www.cnblogs.com/-wenli/p/11079173.html
9.
https://docs.pingcode.com/baike/4975684
通过掌握VBA语言的字符串处理技巧,你可以显著提高在Excel中的工作效率。无论是数据清洗、文本分析还是报表生成,VBA都能帮助你轻松应对各种复杂的办公任务。例如,使用Left、Right和Mid函数提取特定字符,或者利用Replace函数批量替换错误信息,这些操作都可以大大减少手动处理的时间。此外,VBA还提供了丰富的内置函数来实现大小写转换、字符串查找等功能,让你的工作更加高效便捷。
下面为你封装一组进阶的文本处理函数:
'► 文本相似度计算
Public Function SimilarityRatio(ByVal str1 As String, ByVal str2 As String) As Double
'基于编辑距离计算相似度(0-1范围)
Dim maxLen As Long
str1 = CleanString(str1) '假设已实现基础清洁函数
str2 = CleanString(str2)
If str1 = str2 Then
SimilarityRatio = 1
Exit Function
End If
maxLen = WorksheetFunction.Max(Len(str1), Len(str2))
SimilarityRatio = 1 - (LevenshteinDistance(str1, str2) / maxLen)
End Function
'► 莱文斯坦距离计算
Public Function LevenshteinDistance(ByVal s As String, ByVal t As String) As Long
'动态规划实现编辑距离
Dim d() As Long, i As Long, j As Long, cost As Long
Dim m As Long, n As Long
m = Len(s)
n = Len(t)
ReDim d(0 To m, 0 To n)
For i = 0 To m: d(i, 0) = i: Next
For j = 0 To n: d(0, j) = j: Next
For i = 1 To m
For j = 1 To n
cost = Abs(StrComp(Mid(s, i, 1), Mid(t, j, 1), vbTextCompare))
d(i, j) = WorksheetFunction.Min( _
d(i - 1, j) + 1, _
d(i, j - 1) + 1, _
d(i - 1, j - 1) + cost)
Next
Next
LevenshteinDistance = d(m, n)
End Function
'► 模糊匹配查找
Public Function FuzzyMatch(ByVal searchStr As String, ByVal rangeToSearch As Range, Optional threshold As Double = 0.7) As Variant
'返回匹配单元格地址及相似度二维数组
Dim result() As Variant, cell As Range, cnt As Long
ReDim result(1 To rangeToSearch.Count, 1 To 2)
searchStr = CleanString(searchStr)
For Each cell In rangeToSearch
If SimilarityRatio(searchStr, CleanString(cell.Value)) >= threshold Then
cnt = cnt + 1
result(cnt, 1) = cell.Address
result(cnt, 2) = Format(SimilarityRatio(searchStr, cell.Value), "0.00%")
End If
Next
ReDim Preserve result(1 To cnt, 1 To 2)
FuzzyMatch = result
End Function
'► Jaccard相似度计算
Public Function JaccardSimilarity(ByVal strA As String, ByVal strB As String) As Double
'基于词集的相似度计算
Dim wordsA As Variant, wordsB As Variant
Dim union As Collection, intersect As Collection
Set union = New Collection
Set intersect = New Collection
wordsA = Split(RemoveNonAlphanumeric(strA), " ") '假设已实现基础处理函数
wordsB = Split(RemoveNonAlphanumeric(strB), " ")
'计算并集和交集
BuildUnionAndIntersect wordsA, wordsB, union, intersect
If union.Count = 0 Then
JaccardSimilarity = 0
Else
JaccardSimilarity = intersect.Count / union.Count
End If
End Function
'► 私有辅助方法 ◄
Private Sub BuildUnionAndIntersect(ByRef arr1, ByRef arr2, ByRef unionColl As Collection, ByRef intersectColl As Collection)
Dim dict As Object, elem As Variant
Set dict = CreateObject("Scripting.Dictionary")
'处理第一个数组
For Each elem In arr1
elem = LCase(Trim(elem))
If Len(elem) > 0 Then
dict(elem) = 1
AddToCollection unionColl, elem
End If
Next
'处理第二个数组
For Each elem In arr2
elem = LCase(Trim(elem))
If Len(elem) > 0 Then
If dict.exists(elem) Then
If dict(elem) = 1 Then
AddToCollection intersectColl, elem
dict(elem) = 2
End If
Else
AddToCollection unionColl, elem
End If
End If
Next
End Sub
Private Sub AddToCollection(ByRef coll As Collection, ByVal item As String)
'去重添加元素
On Error Resume Next
coll.Add item, item
On Error GoTo 0
End Sub
使用示例:
Sub Demo()
'相似度计算
Debug.Print SimilarityRatio("apple", "apples") '→ 0.8
'模糊匹配查找
Dim matches As Variant
matches = FuzzyMatch("Excel", Range("A1:A10"), 0.6)
'Jaccard相似度
Debug.Print JaccardSimilarity("Hello world", "World hello") '→ 1.0
End Sub
特点说明:
性能优化:莱文斯坦距离使用动态规划算法,处理20字符以内的字符串效率较高
预处理集成:内置CleanString函数(需与您的基础函数整合)进行统一预处理
扩展性设计:模糊匹配函数可直接应用于Excel单元格区域
阈值控制:所有相似度计算均可设置灵敏度阈值
兼容处理:统一使用vbTextCompare进行不区分大小写的比较
注意:需确保已实现引用的基础函数(CleanString、RemoveNonAlphanumeric等),可添加错误处理增强健壮性。对于大数据量场景建议结合数组处理优化性能。
热门推荐
公积金三大调整方向持续助力安居 安居路上的坚实力量
土壤-根系水力连续体在作物抗旱中的作用
慢性疲劳综合征的中医治疗效果
边听歌边写作业,是坏习惯吗?
雅思A类和G类的区别,一文告诉你
【监管者-梦之女巫】基础攻略
百团大战手绘军用地图:一张见证抗战历史的珍贵档案
24 位最具代表性的紫发动漫女孩和女性
张雪峰辟谣"建议普通家庭不要学医":需综合考量多方面因素
《暗黑破坏神4》装备属性与词条搭配详解 提升角色战斗力的终极指南
个税App开具纳税记录指南:步骤详解与真伪查验方法
苹果双系统教程:通过安装BootCamp实现macOS和Windows双系统运行
温柔有力量的表达,这4步即可!
Windows 10 注册表 备份和还原注册表项
五部低成本电影如何以创意逆袭影史,重塑电影魅力
中国十大骗局之Pi Network(π币、pi币、派币、兀币)
银行客户经理的工作内容
《吞食天地2》吕布攻略:如何击败最强战神
弥可保的作用与功效和副作用
男演员自曝晨起心率38次/分钟!心跳多少算正常?
张雪峰谈日语专业:毕业后就业可以干什么?前景如何?
加微信通过率99%的5句话
肺气肿患者的饮食调理与生活注意事项
男星自曝晨起心率38次/分钟!心跳多少算正常?
【时间管理大师】7种时间管理技巧 助你提升工作效率
双侧额窦及筛窦炎的症状、治疗与护理建议
文化创新视域下的古代神话动漫化演绎
会议全向麦克风的原理、优势及应用场景
日本为何在德国最需要时拒绝进攻苏联?
秋冬季儿童该如何选择润肤剂?这几招教你“丝滑”入冬