公告:本站正式转型为非交互式静态网站!
转型:本站将通过笔记和博客的形式继续为大家服务,关于 Mathematica 问答服务请移步至QQ群:365716997
联系:如有问题请联系QQ群管理员,或发送邮件至:lixuan.xyz@qq.com。
感谢:最后非常感谢大家多年来的支持与帮助!
参考《互联网跟帖评论服务管理规定》《中华人民共和国网络安全法》《网络信息内容生态治理规定》《互联网用户账号信息管理规定》

—— 2022-11-27

欢迎来到 Mathematica 问答社区

提问时请贴上文本代码

语法高亮:在编辑器中点击

被禁止的话题:广告破解

请阅读:《提问的智慧》

备用域名:mma.ooo

支持LaTex数学公式
行内公式标识符:\$ 或“$\backslash ($”+“$\backslash )$”,
行间公式标识符:\$\$ 或 “$\backslash [$”+“$\backslash ]$”

社区建议QQ群:365716997

分类

0 投票
1.1k 浏览

比如说有一个字符串ts,有固定的模式a___bca___bc...,我想取a__bc中间的,但是我用下面得方法就把整个字符串都取出来了

ts = "aWISHAMbcaWISAJSbcaSUWJAHbc";
StringCases[ts, "a" ~~ s__ ~~ "bc" :> s]

如下图

另一种方法也是不行

StringCases[ts, "a" ~~ s__ ~~ "bc" :> s, Overlaps -> True]

应该怎么做才能取出中间的

a___bc中间的内容长度不固定,有长有短

分类:文本处理 | 用户: WMN7 (606 分)
修改于 用户:WMN7

1个回答

+3 投票
 
已采纳

Mma默认是贪婪匹配模式,使用懒惰匹配模式可以用Shortest,比如:

ts = "aWISHAMbcaWISAJSbcaSUWJAHbc";
StringCases[ts, "a" ~~ Shortest[s__] ~~ "bc" :> s]

或者使用正则表达式:

ts = "aWISHAMbcaWISAJSbcaSUWJAHbc";
StringCases[ts, RegularExpression["a(.*?)bc"] :> "$1"]

 

用户: 野鹤 (5.1k 分)
采纳于 用户:WMN7
正则表达式完全懵圈。还是模式匹配好用。学一个就行了吧?
使用Mma自己的字符串模式,可以满足常用需求,就是得多写点东西,没有正则表达式简洁。
包含同样多的信息,越是简短的东西就越是复杂。
...