博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
简单的正则表达式
阅读量:7226 次
发布时间:2019-06-29

本文共 873 字,大约阅读时间需要 2 分钟。

在我的博客中有一篇文章介绍了如何在网页中抓取邮箱,撇开其中的java代码不说,我觉得很有必要介绍

一下正则表达式.那么什么是正则表达式呢.如果读过那篇文章的读者不难发现我们就是依靠这个邮箱的

正则表达式来匹配网页中想要抓取的邮箱.

这个正则表达式是:"\\w+@\\w+(\\.\\w+)+"

\w代表任意的数字字母,即[0-9A-Za-z],而\\w中的第一个‘\’是为了将第二个‘\'’转义.即我们可以理解

为'\\w'=‘\w’ 而后面的'+'代表一个或者多个[0-9A-Za-z],而'@'是代表与一个'@'字符进行匹配,后面

又出现'\\w'同意的代表一个或者多个[0-9A-Za-z],而圆括号'()'则代表进行分组,圆括号内代表匹配

个小数点小树点之后又一个或者多个[0-9A-Za-z],而圆括号后面的‘+’号则匹配一个或者多个圆括号内匹配的内容.

邮箱的标准格式:用户名@邮箱服务器域名。如:abc@def.com

 

 

举例‘@’之前的\\w可以代表1507026255,也可以代表m21344,又或者4ns4等等。即匹配邮箱的用户名

而'@'之后的'\\w'则是匹配邮箱的服务器域名,可以是QQ邮箱,可以是163邮箱.而又的邮箱如新浪邮箱

的服务器域名可能是adc@sina.com.cn 后面还需要匹配一个小数点和一些字母因此出现了'(\\.\\w)+'此

表达式代表匹配多个.com类似的服务器域名.

好了通过上面对邮箱正则表达式的详细分析,我详细大家都知道正则表达式是个上面东东了,是不是觉得很有用呢.

我给出我的理解吧:正则表达式就是一组匹配规则用于在网页或者文本中搜索匹配符合要求的字符类型.当然正则

表达式并不简单,需要不断的联系和积累.此外正则表达式作为一种标准在各种技术中都有使用,比如java,linux,javascript

虽然他们在语法的细部可能有略微的差别,但是就作为一种标准而言,其很大程度上是通用的.

 

转载于:https://www.cnblogs.com/vpoet/p/4659752.html

你可能感兴趣的文章
Web Storage相关
查看>>
[PHP内核探索]PHP中的哈希表
查看>>
Apache-drill Architechture
查看>>
WordPress 5.2 Beta 3 发布,要求 PHP 5.6.20 以上版本
查看>>
通通连起来——无处不在的流
查看>>
互联网+时代,看云计算如何改变传统行业
查看>>
ZFS ARC & L2ARC zfs-$ver/module/zfs/arc.c
查看>>
c++类默认拷贝构造函数---浅复制
查看>>
2019年最火热的Golang项目
查看>>
可实现RSSD云硬盘120万IOPS的SPDK IO路径优化实践
查看>>
Vue项目部署遇到的坑(你肯定会遇到!)
查看>>
资源分享计划第三期 0511
查看>>
awk 文本处理
查看>>
【JSConf EU 2018】主题总结 (部分主题已有中文文章)
查看>>
JavaScript面向对象名词详解
查看>>
Java设计模式学习 - 责任链模式
查看>>
JVM,DVM,ART
查看>>
webgl滤镜--会呼吸的痛
查看>>
用Go语言实现微信支付SDK
查看>>
oauth2在php实践
查看>>