首页 > 基础资料 博客日记

正则表达式

2024-09-12 00:00:04基础资料围观131

文章正则表达式分享给大家,欢迎收藏Java资料网,专注分享技术知识

  • 正则表达式是 用某种模式去匹配字符串的一个公式
  • 正则表达式用于 处理字符串和文本

Java中的正则表达式

  • 在Java正则表达式中,需要 使用双斜杠 \ 表示转义符
  • 在Java正则表达式中, 默认区分大小写
  • 在Java正则表达式中,默认是贪婪匹配(最大匹配),会匹配最多的
    非贪婪匹配:在限定符后面加上?号

正则表达式 - API

  • Pattern类

    matches( ):整体匹配。判断整个字符串是否满足格式,返回true或false

  • Matcher

  • PatternSyntaxException


正则表达式 - 语法

转义符

  • 使用正则表达式匹配特殊的字符时,需要使用转义字符
  • 在Java的正则表达式中,使用使用双斜杠 \代表转义字符

预定义字符

边界定位符

限定符

修饰符

用来修改表达式的搜索结果. 这些标志可以任意的组合使用, 它也是整个正则表达式的一部分

  • i:忽略大小写
  • g:全局搜索
  • m:多行

分组-捕获-反向引用

  • 捕获

  • 非捕获


String类的四个正则表达式方法

  • 切割

    String[ ] split(String regex):根据给定正则表达式的匹配拆分此字符串。
    String[ ] split(String regex, int limit):根据匹配给定的正则表达式来拆分此字符串,最多不超过limit个,如果超过了,剩下的全部都放到最后一个元素中。

  • 替换

    String replaceAll(String regex, String replacement): 使 用 给 定 的replacement 替换此字符串所有匹配给定的正则表达式的子字符串。
    String replaceFirst(String regex, String replacement): 使 用 给 定 的replacement 替换此字符串匹配给定的正则表达式的第一个子字符串。

// 目标:将JDK1.3和JDK1.4替换为JAVA
String content = "技术的产JDK1.3生以及为JDK1.4对网络编程哈哈随便";
content=content.****replaceAll("JDK1\\.[3|4]", "JAVA");
System.out.println(content);
  • 匹配正则表达式

    boolean matches(String regex):字符串是否匹配给定的正则表达式


应用实例

必须全部是汉字

public static void main(String[] args) {
    String content = "哈哈";
    String regStr = "^[\u0391-\uffe5]+$";
    
    Pattern pattern = Pattern.compile(regStr);
    Matcher matcher = pattern.matcher(content);
    
    if(matcher.find()){
        System.out.println("满足格式:"+matcher.group(0));
    }else{
        System.out.println("格式错误!");
    }
}

URL地址验证

public static void main(String[] args) {
    String content = "https://www.bilibili.com/video/BV1Eq4y1E79W/?p=17&spm_id_from=pageDriver&vd_source=861db91ebfeac0ca1eb519f4fe726bbc";
    content = "www.baidu.com";
    
    String regStr = "^(((ht|f)tps?):\\/\\/)?([^!@#$%^&*?.\\s-]([^!@#$%^&*?.\\s]{0,63}[^!@#$%^&*?.\\s])?\\.)+[a-z]{2,6}\\/?";
    Pattern pattern = Pattern.compile(regStr);
    Matcher matcher = pattern.matcher(content);
    
    if(matcher.find()){
        System.out.println("满足格式:"+matcher.group(0));
    }else{
        System.out.println("格式错误!");
    }
}

结巴字符串 去重

String content = "我....我要....学学学学....编程java!";

//先去掉 ....
String regStr = "\\.{4}";
Pattern pattern = Pattern.compile(regStr);
Matcher matcher = pattern.matcher(content);
content=matcher.replaceAll("");
System.out.println(content);

regStr="(.)\\1+"; //分组 反向引用
//pattern = Pattern.compile(regStr);
//matcher = pattern.matcher(content);
//content=matcher.replaceAll("$1"); //外部反向引用

//正则表达式调用链
content=Pattern.compile(regStr).matcher(content).replaceAll("$1");
System.out.println(content);// 我要学编程java!


文章来源:https://www.cnblogs.com/meitianyouheng/p/18409260
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!

标签:

相关文章

本站推荐

标签云